基于hadoop的微博网络影响力最大化研究与实现

基于hadoop的微博网络影响力最大化研究与实现

ID:35179741

大小:4.30 MB

页数:65页

时间:2019-03-20

基于hadoop的微博网络影响力最大化研究与实现_第1页
基于hadoop的微博网络影响力最大化研究与实现_第2页
基于hadoop的微博网络影响力最大化研究与实现_第3页
基于hadoop的微博网络影响力最大化研究与实现_第4页
基于hadoop的微博网络影响力最大化研究与实现_第5页
资源描述:

《基于hadoop的微博网络影响力最大化研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文论文题目:基于Hadoop的微博网络影响力最大化研究与实现作者姓名经志军指导教师田贤忠教授学科专业计算机技术培养类别全日制专业学位硕士所在学院计算机科学与技术学院提交日期2016年4月15日渐江工业大学学位论文原创性声明本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究工作所取得的研巧成果。除文中己经加标往引用的内容外,本论文不包含其他个人或集体已经发表或撰写过的研巧成果,也不含为获得浙江工业大学或其它教育机构的学位证书而使用过的材料。对本文的研巧作出重要贡献的个人和集体,均已在文中明确

2、方式标明。本人承担本声明的法律责任。作者签名;日期:列年月之日挺秦罕5良^学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部口或机构送交论文的复印件和电子版,允许论文^被查阅和借阅。本人授权浙江工业大学可^^?将本学位论文的全部或部分内容编入有关数据库进行检索,可采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于一1、保密□。,在年解密后遺用本授权书2、保密己,年解密后适用本授权书。3、不保密它""(请在W上相应方

3、框内打V):办年r月^日作者签名;%日期导师签名;曰期曼月2曰^浙江工业大学硕士学位论文基于Hadoop的微博网络影响力最大化研究与实现作者姓名:经志军指导教师:田贤忠教授浙江工业大学计算机科学与技术学院2016年4月DissertationSubmittedtoZhejiangUniversityofTechnologyfortheDegreeofMasterResearchandRealizationoftheMaximizationoftheMicro-blogNetworkInfluencebasedonHadoo

4、pCandidate:ZhijunJingAdvisor:ProfessorXianzhongTianCollegeofComputerScienceandTechnologyZhejiangUniversityofTechnologyApr2016浙江工业大学硕士学位论文基于Hadoop的微博网络影响力最大化研究与实现摘要随着互联网技术的蓬勃发展,大量社交媒体已经成为人们生活必不可少的一部分,主要有Facebook,Twitter,微博等。其中新浪微博已成为人们互相沟通,传播信息的一个重要途径。近年来针对新浪微博的各类研究纷纷兴起,其

5、中影响力最大化的研究已成为热点研究对象之一。影响力最大化问题就是在网络中找到大小为k的具有最大影响范围的节点集。这在舆情监控和商业广告投放等方面具有巨大的潜在价值。目前,针对社会网络的影响力最大化算法的研究已经相对成熟。这些传统算法对于各种社会网络具有普遍的适用性。然而适用性的弊端在于欠缺对于某个具体社会网络(如微博网络)的针对性,导致这些算法在微博网络中的准确率较低而时间复杂度极高。本文针对上述问题提出了基于Hadoop的微博网络影响力最大化算法。本算法充分考虑微博网络自身的特性,重新定义了用户间影响力和用户激活阈值用来计算每个微博用

6、户潜在影响力值(PI值)。启发阶段中每次都选取PI最大的用户作为种子节点去激活其他用户并更新在激活过程中被影响到的用户的PI值,之后在贪心阶段中每次都选取具有最大影响范围增量的用户作为种子节点。同时,本算法的设计是基于Hadoop分布式计算框架之上,这样就可以充分利用Hadoop分布式计算平台强大的数据处理能力来解决微博网络计算数据量庞大的问题。最后设计并实现了一个运用本文算法计算微博影响力最大化的系统来将提出的想法应用于实际。本文在Hadoop分布式计算平台上通过一系列与传统贪婪算法的对比实验来验证本文算法的优越性,其中实验所用到的原

7、始数据均为真实的新浪微博用户数据。通过实验发现,在某些的参数条件下,本文算法的影响范围要远远好于贪婪算法,而算法的计算时间却远小于贪婪算法。所以本文算法在微博网络上的影响范围和时间复杂度都有较好的表现,相较于传统贪婪算法具有一定的优越性。关键词:Hadoop,影响力最大化,微博网络,启发式算法,贪心算法i浙江工业大学硕士学位论文RESEARCHANDREALIZATIONOFTHEMAXIMIZATIONOFTHEMICRO-BLOGNETWORKINFLUENCEBASEDONHADOOPABSTRACTWiththerapiddev

8、elopmentofInternettechnology,alargenumberofsocialmediahavebecomeanindispensablepartofpeople'slives,incl

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。