欢迎来到天天文库
浏览记录
ID:39864354
大小:5.15 MB
页数:61页
时间:2019-07-13
《基于hadoop的微博用户影响力排名算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:TP391密级:UDC:华东理工大学学位论文基于Hadoop的微博用户影响力排名算法研究陈浩指导教师姓名:过弋副教授华东理工大学信息科学与工程学院申请学位级别:硕士专业名称:计算机软件与理论论文定稿日期:2013。11.18论文答辩日期:2014.01。11学位授予单位:学位授予日期:华东理工大学≯
2、吹;、}垆答辩委员会主席:评阅人:顾春华教授付相君副教授作者声明我郑重声明:本人恪守学术道德,崇尚严谨学风。所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的结果。除文中明确注明和引用的内
3、容外,本论文不包含任何他人已经发表或撰写过的内容。论文为本人亲自撰写,并对所写内容负责。论文作者签名:体、浩洲(降1月l怕华东理工大学硕士学位论文第工页基于HadOop的微博用户影响力排名算法研究摘要随着互联网和移动设备的发展,人与人之间的互动和联系越来越依赖社交网络。微博作为最流行的社交网络平台之一,在信息和言论传播、用户沟通交流等方面所扮演的角色越来越重要。微博影响力作为用户的重要衡量指标,是微博关系的基础,用户影响力越大,所受到的关注程度也就越高,对网络的影响、对信息的传播作用也就越大。通过影响力大的
4、用户进行信息扩散、舆论导向、商品推介和宣传,无疑将收到事半功倍的效果,这对于社会信息传播和商业营销来说意义重大。在当下IT领域,不管是学术界还是业界,不管是企业、媒体还是技术人员,似乎都在谈论“大数据"。从技术的角度来说,Hadoop是大数据最重要的标签之一。Hadoop是一个能够让用户简易架构和使用的分布式计算平台,用户可以便捷地在Hadoop上开发运行处理海量数据的应用程序。本文首先研究与讨论了Hadoop平台及其相关技术,以及传统微博用户影响力评定方法,比如追随者数量排名算法、PageR£111l(排
5、名算法和用户行为权值排名算法等。在此基础上提出了基于Page&111l(改进的用户影响力排名算法Use础。UserRank算法从用户自身质量及其追随者(即follower)质量入手,考虑追随者数量、追随者质量、评论率、转发率和是否微博认证用户等因素,全面分析得到用户微博影响力指数。最后,UserRalll【算法在搭建的Hadoop集群上实现,实验结果表明UserR£m.1【算法相对于追随者数量排名算法、Page胁lI【算法等都具有很大优势,信息更充分,排名更真实,客观地反映出用户的实际影响力。关键词:微博平
6、台;用户影响力;PageRalll【算法;Hadoop平台;MapReduce第1I页华东理工大学硕士学位论文Micr0BlogUserRanl‘ingResearchBasedonHadoopABSTRACTNo、Ⅳadays,t11esocialne咖埘ngplatf.o眦sarebecomingsoindiSpensabletopeople.Microblog,oneof廿lemoStpopularsocialnetwo尚ngplatfIoms,playsaIlincreaSinglyimponaIl
7、troleoninfo肌ationspreadiIlgandusercommuIlication.Theuserinfluence础ngisoneoftllemostimportantindexesofuser,anditisthebasisofuserrelationship.The黟eatertheuserinnuence,thegreaterthee航ctoninf.o姗ationSpreading.ByaIlalyzingmeuserbasiciⅢ’omationdataanduserbeha访or
8、datawithdatamiIling,wecangettheuserinnuenceraIll【ing.ItcaJlnotonlypr0Videtecllllicalsupportandsolutionsforthemicrobloggingplatfom,butalsomal(eaprofitincooperation诵madvertisementowners.InⅡ1eITfield,ente印rises,mediaaIldtecllllicalpersoIulel,arealltall【ingabo
9、ut”bigdata”.FromthepointoftecllIlology,Hadoopisoneofthemostimportantsymbolsofbigdata.HadoopisadistributedcomputingplatfIom、Ⅳ_IlichuserScaJleasjlysetupanduse.UserscaIldeVelopand11lnbigdatapr.ocessprogIl锄onHado
此文档下载收益归作者所有