微博转发预测算法性能比较 毕业论文

微博转发预测算法性能比较 毕业论文

ID:343371

大小:1.81 MB

页数:67页

时间:2017-07-26

微博转发预测算法性能比较  毕业论文_第1页
微博转发预测算法性能比较  毕业论文_第2页
微博转发预测算法性能比较  毕业论文_第3页
微博转发预测算法性能比较  毕业论文_第4页
微博转发预测算法性能比较  毕业论文_第5页
资源描述:

《微博转发预测算法性能比较 毕业论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、清华大学题目:微博转发预测算法性能比较系别:计算机科学与技术系专业:计算机科学与技术姓名:指导教师:2013年6月19日关于学位论文使用授权的说明本人完全了解清华大学有关保留、使用学位论文的规定,即:学校有权保留学位论文的复印件,允许该论文被查阅和借阅;学校可以公布该论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存该论文。(涉密的学位论文在解密后应遵守此规定)签名:导师签名:日期:中文摘要随着社交网站的迅速风靡与发展,社交网络及其带来的消息分享机制的相关研究得到越来越多的研究者们的关注。消息分享预测问题,特别是在微博网站上用户的锐推等微博转发行为

2、的预测问题,是其中非常重要的一个研究课题。本文针对微博转发行为预测问题,首先提出了一个基本的预测算法评测系统框架。该系统解决了原始微博数据的抓取和预处理,以及用户微博的转发以及忽略行为的判定,微博和用户的特征提取等问题,为解决微博转发行为预测问题提供了技术基础。其次,本文详细分析了现有文献和工作中的微博转发行为预测算法。以有代表性的逻辑斯蒂回归算法,支持向量机,因子图模型以及传染病模型这四个算法为例,阐述了它们的基本原理。最后,本文通过定量实验分析了不同微博转发行为预测算法的在局部预测问题和全局预测问题方面的性能,并且从算法的原理等方面出发给出了定性的分析

3、。关键词:微博转发;逻辑斯蒂回归;支持向量机;因子图模型;传染病模型IABSTRACTWiththerapiddevelopmentoftheSocialNetworkSites,themessagesharingmechanismisbecomingmoreandmorepopularinresearchnowadays.Amongthem,topicsrelatedtothemessageprediction,especiallythepredictionofthemicroblogretweeting,areoneofthemostimportant

4、subjects.Wearegoingtocomparedifferentexistingsolutionsofthemicroblogretweetingpredictionprobleminthispaper.Firstlyweconstructedabasicpredictionalgorithmtestingsystemwhichsolvestheorigindatacrawlingandpreprocessingproblem.Italsohandlesthefeatureretrievingandusersocialactionjudgingp

5、roblem.Thissystemprovidestechnicalbaseforsolvingthemicroblogretweetingpredictionproblem.Secondly,weanalyzethefourrepresentativealgorithmsofsolvingthetargetproblemindetails,includingtheLogisticRegression,theSupportVectorMachine,theFactorGraphModelandtheEpidemicModel.Finally,wecondu

6、cteddifferentexperimentsforquantitativelyanalyzingthealgorithms'performancesolvingboththelocalpredictionproblemandtheglobalpredictionproblem,respectively.Keywords:Retweeting;LogisticRegression;SVM;FactorGraphModel;EpidemicModel目录第1章引言11.1研究背景11.2微博转发预测问题研究现况21.3论文的主要工作内容31.4论文的组织4

7、第2章微博转发预测评测系统框架52.1微博转发预测问题定义52.2数据抓取与预处理72.2.1Twitter开发者平台简介72.2.2TwitterOAuth2.0用户授权机制介绍82.2.3Twitter平台RESTAPIv1.1介绍82.2.4数据抓取算法设计与实现92.3转发,忽略与未接收动作的识别112.4数据初步观察及特征提取13第3章微博转发行为预测算法分析153.1经典分类算法153.2因子图模型183.3传染病模型223.3.1传染病模型简介223.3.2传统SIR模型介绍233.3.3用于微博转发预测问题的扩展SIR模型23第4章转发预测

8、算法实验结果分析274.1实验环境设置274.2局部预测性能比较2

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。