欢迎来到天天文库
浏览记录
ID:53029710
大小:417.92 KB
页数:6页
时间:2020-04-14
《基于微博行为数据的不活跃用户探测-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第44卷第3期电子科技大学学报、b1.44NO.32015年5月JournalofUniversityofElectronicScienceandTechnologyofChinaMay2015基于微博行为数据的不活跃用户探测刘晶,一,王峰,胡亚慧一,李石君(1.武汉大学计算机学院武汉430072;2.中南民族大学计算机科学学院武汉430074;3.空军预警学院计算机教研室武汉430000)【摘要】随着微博注册用户的增长,探测不活跃账号,自动判定用户活跃度有重要的商业价值。该文提出了一种自动检测算法并通过实验验证。算法核心是提出的影响用户活跃
2、度的4个判定因子,可由用户行为计算得到。算法包含用户活跃度概率层次模型(ADPHM)和用户评分模型(usM)。ADPHM~型计算用户是不活跃用户的概率;USM模型计算用户活跃度得分。实验数据集包含了新浪微博2316281个用户信息和141322O19条微博内容。实验结果表明,该算法能在线性时间复杂度下自动检测出不活跃账号,完善用户可信度评估体系。关键词活跃度;自动识别;不活跃用户;微博;社交网络中图分类号TP182文献标志码Adoi:10.3969~.issn.1001.0548.2015.03.016DetectingInactiveUse
3、rsfromBehaviorDataBasedonWeiboLIUJing一,WANGFeng’,HUYa.hui,andLIShijun(1.ComputerSchool,WuhanUniversityWuhan430072;2.CollegeofComputerScience,South-CentralUniversityforNationalitiesWuhan430074;3.ComputerTeachingandResearchsection,AirForceEarlyWarningAcademyWuhan430000)Abstra
4、ctWiththegrowthofregisteredusersinmicroblog,howtodetectinactiveaccountsandautomaticallyiudgetheuseractivityhaveanimportantcommercialvalue.TOmeetthisneed,anautomaticdetectionalgorithmisproposedandexperimentallytested.Thekernelofautomaticdetectionalgorithmisfourdeterminingfac
5、torsofinactiveuserswedefined,whichcanbecalculatedbyuser’Sbehavior.ThealgorithmcontainsUserActiveDegreeProbabilityHierarchicalModel(ADPHM)andUserScoringModel(USM).TheADPHMisemployedtoestimatetheprobabilityofinactiveuser:theUSMisusedtogiveauser’Sactivityscore.Experimentdataco
6、ntains23l6281users’informationandtheir141322019tweetscrawledfromSina.Weibo.ExperimentalresultsshowthatthismethodCandetectinactiveusersautomaticallyandimproveuserconfidenceevaluationsysteminlineartimecomplexity.Kevwordsactivity;automaticidentification;inactiveusers:microblog
7、;socialnetwork自2006年JackDorsey~建Twitter~来,以微博生的信息和用户与用户之间的交互在社交网站上留fMicroblog)为载体的社交网络席卷互联网领域。微下了各种足迹,直接促成了网络大数据时代的到来。博以其快速便捷的特性风靡全球,迅速成为新一代新浪微博是国内最大最具有影响力的微博网信息传播形式。随着微博、微信等社交网络,移动站。而最近,香港大学研究人员进行的一项研究显互联网,智能终端的快速发展,出现了大量的与人示,新浪微博注册用户数量与真实用户严重不符。密切相关的数据。如何从这些大数据中更好地理解57%的新
8、浪微博用户的信息流上没有任何内容,其用户和为用户服务是信息产业中一个重要研究方向。帐户是非活跃帐户或由营销公司创建的所谓“僵尸近十年来,在线社交网络飞速发展。国内各
此文档下载收益归作者所有