欢迎来到天天文库
浏览记录
ID:37062778
大小:4.55 MB
页数:59页
时间:2019-05-16
《基于微博用户的行为分析与应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文基于微博用户的行为分析与应用研究作者姓名王玲学科专业概率论与数理统计指导教师杨立洪教授所在学院数学学院论文提交日期2018年4月TheStudyofBehaviorAnalysisandApplicationbasedonMicroblogUserADissertationSubmittedfortheDegreeofMasterCandidate:WangLingSupervisor:Prof.YangLihongSouthChinaUniversityofTechnologyGuangzhou,Ch
2、ina摘要微博在社交网络中占据重要地位,是人们快速获取各种最新资讯的平台,其随时性、时效性特点一直备受大众喜爱。一方面微博为大众提供娱乐休闲、生活服务的信息分享和交流;另一方面也实现消息的裂变传播。新浪微博作为国内最主流、最具人气的社交网站一直位于Alexa排名前列。对微博历史数据进行研究可以寻找微博热词,定位公众关心的焦点问题,同时根据用户评论,也可以间接了解公众的价值导向。目前国内对微博的三大用户行为:转发、评论和点赞进行综合研究的文献较少。因此,本文重点研究建立用户行为的整体预测模型。具体研究内容如下:第一,
3、本文从博文内容、用户行为和时间分布这三方面来选取模型特征。首先,针对博文内容进行挖掘,选取文本特征关键词。其次,针对不同用户的转发次数分布的不均衡性,利用FCM(模糊C均值)算法对微博用户的转发数进行模糊聚类,通过各簇权重来刻画用户的历史记录。然后,针对用户发表微博的时间分布特点,计算出不同时刻微博用户的平均转发、评论和点赞数。显然,一条微博如果是在用户最大可能性登录微博平台的时间段内发布,则这条微博被阅读的可能性会得到极大提高。最后,本文综合以上特征构建了距离加权KNN模型和FCM加权KNN预测模型。第二,本文选
4、用整体评分作为模型衡量指标,比较普通KNN算法模型,距离加权KNN模型和FCM加权KNN模型的预测效果。本文同时考虑了文本特征词个数对模型预测结果的影响,分别选出100、150、200、250、300个不等的文本特征词作为预测模型的输入,观察整体评分的波动情况。最后,通过对三种算法的比较,本文得出当文本特征词个数为100时,FCM加权KNN预测模型能实现26.62%的整体评分且高于普通KNN算法和距离加权KNN算法。说明在实验范围内FCM加权KNN模型能挖掘出更多微博信息,且具有普通KNN算法和距离加权KNN算法的
5、共同优势。关键词:微博用户;行为分析;文本挖掘;KNN算法;FCM加权IABSTRACTMicroblogplaysanimportantroleinthesocialnetwork,andit’salsoaplatformtoacquirethelatestinformationquicklyforpeople.thetimelinessofmicroblogispopularwiththepublic.Ontheonehand,provideentertainment,lifestyleservices,inf
6、ormationsharingandexchangeforthepublic.Ontheotherhand,achievethefissionofthemessage.Asthemostpopularsocialplatform,sinaweibohasbeenlocatedintheforefrontofAlexa.Thestudyofsinaweibohistoricaldatacanlocatethefocusofpublicconcernandlookforhotwords,whichcanhelpgove
7、rnmentunderstandthepublic'svalueorientationindirectlybasedonuserhistoricalcommentsatthesametime.Atpresent,therearefewstudiesonthethreemajorbehaviorsbasedonmicroblogincludingthenumberofforwarding,commentaryandpraiseathomeandabroad.Therefore,thisarticlefocuseson
8、howtoestablishtheoverallforecastingmodelofthethreemajorbehaviors.Thespecificresearchcontentsareasfollows:First,thisarticleselectsthemodelfeaturesfromthreeaspects:thecontentofmicrob
此文档下载收益归作者所有