欢迎来到天天文库
浏览记录
ID:53030024
大小:658.66 KB
页数:5页
时间:2020-04-14
《基于转发层次分析的新浪微博热度预测研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第4l卷第7期计算机工程2015年7月VO1.41NO.7ComputerEngineeringJuly2015·先进计算与数据处理·文章编号:1000-3428(2015)07~031-05文献标识码:A中图分类号:TP311.5基于转发层次分析的新浪微博热度预测研究翟晓芳,刘全明,程耀东,胡庆宝,李海波(1.山西大学计算机与信息技术学院,太原030006;2.中国科学院高能物理研究所计算中心,北京100049)摘要:微博作为新型的消息传播媒介,其影响力和传播速度都超越了传统主流媒体,预测微博热度对舆情监测、政府宣传
2、、企业营销及热点推送等具有重要意义。通过分析微博转发的层次规律,结合转发量、转发深度及广度指标,定义新的热度指数计算方法。将微博热度划分为5个等级,对转发数大于100的微博预测其热度达到特定等级的概率。使用有监督的机器学习算法,先后提取训练样本的静态和动态特征训练热度预测模型。通过自主开发的BigData爬虫开放平台获取来源于新浪微博的训练样本,并应用十折交叉验证法进行实验,结果表明,相比只使用静态特征的热度预测模型,加入微博动态特征能有效提高预测性能,平均F1值达到76.9%关键词:微博;爬虫;静态特征;动态特征;热
3、度指数;多分类问题中文引用格式:翟晓芳,刘全明,程耀东,等.基于转发层次分析的新浪微博热度预测研究[J].计算机工程,201541(7):31—35.英文引用格式:ZhaiXiaofang,LiuQuanming,ChengYaodong,eta1.ResearchonHotnessPredictioninSinaMicroblogBasedonForwardLevelAnalysis[J].ComputerEngineering,2015,41(7):31—35ResearchonHotnessPredictioni
4、nSinaMicroblogBasedonForwardLevelAnalysisZHAIXiaofang,LIUQuanming,CHENGYaodong,HUQingbao,LIHaibo(1.CollegeofComputer&InformationTechnology,ShanxiUniversity,Taiyuan030006,China;2.ComputingCenter.InstituteofHighEnergyPhysics,ChineseAcademyofSciences,Beijing100049,
5、China)【Abstract】Microblogisanewtypeofnewsmedia,anditsinfluenceandpropagationspeedsurpassestraditionalmajormedia.Therefore,ithasagreatimportancetopredicthotnessinmicroblogforpublicopinionmonitoring,governmentpropaganda,corporationmarketingandpopularissuespushing.
6、Throughanalyzingmicroblogforwardlevelwhichcombiningtheeffectsoftheforwardindex,forwarddepthandbreadthindex,thispapergivesanewdefinitionofcalculatingthehotnessindexofmicroblog.Thendependonthisdefinition,thehotnessindexofthemicroblogisclassifiedasfivelevels.Thegoa
7、listopredictthehotnessofmicroblogwhoserepostcountisover100toachieveaspecifiedleve1.Byusingsupervisedmachinelearningalgorithm,itsuccessivelyextractsthestaticattributesanddynamicrepostcharacteristicsofthetrainingsamplestotrainhotnesspredictionmode1.Thetrainingsamp
8、lesisfromSinamicroblogiscaughtbyusingself—developedBigDataopencrawlerplatform.Experimentalresultbyusing10一foldcross—validationshowsthat,comparedwithhotnesspredictionm
此文档下载收益归作者所有