博客社区发现及其主题抽取技术的研究

博客社区发现及其主题抽取技术的研究

ID:34530842

大小:4.57 MB

页数:88页

时间:2019-03-07

博客社区发现及其主题抽取技术的研究_第1页
博客社区发现及其主题抽取技术的研究_第2页
博客社区发现及其主题抽取技术的研究_第3页
博客社区发现及其主题抽取技术的研究_第4页
博客社区发现及其主题抽取技术的研究_第5页
资源描述:

《博客社区发现及其主题抽取技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文论文题目博客社区发现及其主题抽取技术的研究研究生姓名刘兆庆指导教师姓名伏玉琛专业名称管理科学与工程研究方向商务智能工程论文提交日期2013年4月博客社区发现及其主题抽取技术的研究中文摘要博客社区发现及其主题抽取技术的研究中文摘要近年来,互联网的高速发展推动了电子商务的崛起和发展,电子商务帮助众多企业赚取了高额利润,也深深地改变了人们传统的生活方式。但是,如何制定有效的网络营销方案更好地促进电子商务的运作成为众多电子商务企业的难题。而Blog作为Web2.0的典型应用,通过频繁的链接及评论回复等交互方式形成了庞大的社会网络,且Blog是人们思想行为在网络虚拟社

2、区中的体现,因此快速有效地发现具有明确主题的Blog社区,有利于企业制定合理的营销方案,实现精准的网络营销,达到利润最大化目标,具有重要的现实应用价值。目前,基于链接分析的社区发现算法存在诸多缺陷,且发现的Blog社区不具有主题信息,无法反映社区的兴趣点。针对上述问题,本文研究工作主要如下:(1)确定了链接分析和内容分析结合发现Blog社区及主题抽取的整体思路。(2)介绍了Blog的基本概念、Blog链接和页面数据模型以及成熟的社区发现算法。比较了Blog社区发现算法的优劣,确定了将拖网算法作为本文研究的基础算法。(3)提出了“基于FCA的Blog社区发现算法”。该算法

3、通过概念格的代数消解对社区核心进行划分及合并,有效解决了拖网算法中严格的社区定义所导致的发现社区数量过多、社区间重复率过高以及社区内容贫乏等缺陷。(4)提出了“基于LSA的Blog社区主题抽取方法”。该方法对Blog社区内容TF-IDF特征抽取之后进行LSA降维处理,并提出奇异矩阵自动k值截取方法和大矩阵自动分割方法,提高了该方法的准确性和效率,凸显了Blog社区的主题信息。(5)在Blog社区发现算法和主题抽取技术的基础上,结合异步网络爬虫技术,设计并实现了拓展性更强的Blog社区发现原型系统。关键字:社区发现,主题抽取,精准网络营销,形式概念分析,潜在语义分析作者:

4、刘兆庆指导老师:伏玉琛IAbstractResearchontheBlogCommunityDetectionanditsThemeExtractionTechnologyResearchontheBlogCommunityDetectionanditsThemeExtractionTechnologyAbstractInrecentyears,therapiddevelopmentoftheInternethaspromotedtheriseanddevelopmentofe-commerce,andmoreandmoreenterprisesearnedhighpr

5、ofitsthroughtheemergingmodelofe-commerce,whichalsoprofoundlychangedthetraditionalwayoflifeofthepeople.However,howtodevelopeffectiveonlinemarketingprogramsinordertoimprovetheoperationofe-commercebecomestobeadifficultproblemofe-commercebusinesses.Blog,asthetypicalapplicationsofWeb2.0,ismad

6、etoformahugesocialnetworkbytheinteractsuchasfrequentlinksandcommentsreplies.Blogisalsoamanifestationofpeople'sthinkingandbehaviorinthenetworkofvirtualcommunities.Therefore,findingtheblogcommunityquicklyandefficientlyandextractiingthethemeofthecommunityaccuratelyisbenefitforcompaniesdevel

7、oppingareasonablemarketingprograms,realizingaccuratenetworkmarketinginordertoreachthegoalofmaximizingprofits,andthushasimportantpracticalvalue.Thoughmanyalgorithmscoulddetectblogcommunitiesbasedonlinkanalysisnow,theyallhavesomeproblems.Andtheblogcommunitiesdetectedbythemd

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。