基于hadoop的微博用户影响力排名算法研究

基于hadoop的微博用户影响力排名算法研究

ID:39864354

大小:5.15 MB

页数:61页

时间:2019-07-13

基于hadoop的微博用户影响力排名算法研究_第1页
基于hadoop的微博用户影响力排名算法研究_第2页
基于hadoop的微博用户影响力排名算法研究_第3页
基于hadoop的微博用户影响力排名算法研究_第4页
基于hadoop的微博用户影响力排名算法研究_第5页
资源描述:

《基于hadoop的微博用户影响力排名算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP391密级:UDC:华东理工大学学位论文基于Hadoop的微博用户影响力排名算法研究陈浩指导教师姓名:过弋副教授华东理工大学信息科学与工程学院申请学位级别:硕士专业名称:计算机软件与理论论文定稿日期:2013。11.18论文答辩日期:2014.01。11学位授予单位:学位授予日期:华东理工大学≯

2、吹;、}垆答辩委员会主席:评阅人:顾春华教授付相君副教授作者声明我郑重声明:本人恪守学术道德,崇尚严谨学风。所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的结果。除文中明确注明和引用的内

3、容外,本论文不包含任何他人已经发表或撰写过的内容。论文为本人亲自撰写,并对所写内容负责。论文作者签名:体、浩洲(降1月l怕华东理工大学硕士学位论文第工页基于HadOop的微博用户影响力排名算法研究摘要随着互联网和移动设备的发展,人与人之间的互动和联系越来越依赖社交网络。微博作为最流行的社交网络平台之一,在信息和言论传播、用户沟通交流等方面所扮演的角色越来越重要。微博影响力作为用户的重要衡量指标,是微博关系的基础,用户影响力越大,所受到的关注程度也就越高,对网络的影响、对信息的传播作用也就越大。通过影响力大的

4、用户进行信息扩散、舆论导向、商品推介和宣传,无疑将收到事半功倍的效果,这对于社会信息传播和商业营销来说意义重大。在当下IT领域,不管是学术界还是业界,不管是企业、媒体还是技术人员,似乎都在谈论“大数据"。从技术的角度来说,Hadoop是大数据最重要的标签之一。Hadoop是一个能够让用户简易架构和使用的分布式计算平台,用户可以便捷地在Hadoop上开发运行处理海量数据的应用程序。本文首先研究与讨论了Hadoop平台及其相关技术,以及传统微博用户影响力评定方法,比如追随者数量排名算法、PageR£111l(排

5、名算法和用户行为权值排名算法等。在此基础上提出了基于Page&111l(改进的用户影响力排名算法Use础。UserRank算法从用户自身质量及其追随者(即follower)质量入手,考虑追随者数量、追随者质量、评论率、转发率和是否微博认证用户等因素,全面分析得到用户微博影响力指数。最后,UserRalll【算法在搭建的Hadoop集群上实现,实验结果表明UserR£m.1【算法相对于追随者数量排名算法、Page胁lI【算法等都具有很大优势,信息更充分,排名更真实,客观地反映出用户的实际影响力。关键词:微博平

6、台;用户影响力;PageRalll【算法;Hadoop平台;MapReduce第1I页华东理工大学硕士学位论文Micr0BlogUserRanl‘ingResearchBasedonHadoopABSTRACTNo、Ⅳadays,t11esocialne咖埘ngplatf.o眦sarebecomingsoindiSpensabletopeople.Microblog,oneof廿lemoStpopularsocialnetwo尚ngplatfIoms,playsaIlincreaSinglyimponaIl

7、troleoninfo肌ationspreadiIlgandusercommuIlication.Theuserinfluence础ngisoneoftllemostimportantindexesofuser,anditisthebasisofuserrelationship.The黟eatertheuserinnuence,thegreaterthee航ctoninf.o姗ationSpreading.ByaIlalyzingmeuserbasiciⅢ’omationdataanduserbeha访or

8、datawithdatamiIling,wecangettheuserinnuenceraIll【ing.ItcaJlnotonlypr0Videtecllllicalsupportandsolutionsforthemicrobloggingplatfom,butalsomal(eaprofitincooperation诵madvertisementowners.InⅡ1eITfield,ente印rises,mediaaIldtecllllicalpersoIulel,arealltall【ingabo

9、ut”bigdata”.FromthepointoftecllIlology,Hadoopisoneofthemostimportantsymbolsofbigdata.HadoopisadistributedcomputingplatfIom、Ⅳ_IlichuserScaJleasjlysetupanduse.UserscaIldeVelopand11lnbigdatapr.ocessprogIl锄onHado

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。