基于半监督学习的微博谣言检测分析

基于半监督学习的微博谣言检测分析

ID:32145554

大小:3.97 MB

页数:50页

时间:2019-01-31

基于半监督学习的微博谣言检测分析_第1页
基于半监督学习的微博谣言检测分析_第2页
基于半监督学习的微博谣言检测分析_第3页
基于半监督学习的微博谣言检测分析_第4页
基于半监督学习的微博谣言检测分析_第5页
资源描述:

《基于半监督学习的微博谣言检测分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据山东大学硕士学位论文UCIdatasetsprovethatthealgorithmiseffectivelyandefficiently.Inaddition,onthebasisofresearchofimbalanceddatasetsclassificationproblem,introducingmachinelearningmethodsofimbalanceddataclassificationtomicroblogl'H/norsdetectionfield,givingaframeworkofmi_croblogIqa/ilord,etec

2、tion.Finally,twogroups’microbloglq.1morsempiricalexperimentsillustratetheeffectivenessandsuperiorityofthealgorithm.Shownbytheexperimentofextractingda.tafromSinaMicroblogplatform,thealgorithminthethesiscallsolvetheproblemsincludinghighcostoflabelingmicroblogrumolsandlowdetectionaccuracy

3、rateresultedinimbalanceofdatacategoryintheMicroblogrumordetection.Inconclusion,itissuitableforhugedatasetsmicroblogdataanalysisandrumorsdetection.Keywords:Microblog;Rumordetection;lmbalancedData;Semi-supervisedlearning;万方数据山东大学硕士学位论文第一章绪论1.1研究背景微博(Microblog)是一种面向社会性网络服务(SocialNetworkin

4、gServices,SNS)的广播式的社交网络平台,用户可以通过浏览器、智能手机以及其他智能联网的客户端发送信息,从而实现即时信息分享。微博使用的便捷性和即时性、信息分享的开放性和匿名性、传播的广泛性和迅速性,颠覆了原有传统媒介的信息传播形态,缔造了去中心化的传播格局,使得其成为互联网新时代中改变人们生活方式和舆论格局的新型网络载体。2006年3月美国Twitter的推出标志着微博服务的正式面世。经过数年的快速发展,Twitter得到了广泛的应用,成为最具影响力的微博服务之一,其活跃注册用户高达6.46亿,平均每日推文发送量超过5.8亿条1。微博作为一种新颖、简单、

5、便捷的网络媒体形式,大大满足了人们表达自我的需求,自2007年进入国内以来,经过短短几年井喷式地发展,已经成为中国网民使用的主流应用之一。图1-1显示了2010年至2014年间中文微博的发展态势。可以看出,2010年至2013年3年时间内,中文微博取得了日新月异的发展,并在快速发展中逐渐走向成熟,2014年后随着各微博服务商的战略调整和其间竞争的逐步缓和,微博结束了其用户规模爆发式增长的态势,不论是用户规模还是使用率均持续走低,并逐渐趋于平稳。虽然由于各种原因使得目前微博用户有所流失,但是由于微博集成了社交、休闲、娱乐、广告营销等诸多互联网功能,仍然是社交媒体的主流

6、应用。据中国互联网信息中心(CNNIc)公开数据显示,我国网民规模在2014年年底就已突破6.49亿,其中微博用户规模达2.49亿,微博网民使用率38.4%,平均每日发布微博多达2.3亿条【1

7、。1http://www.statisticbrain.com/twitter-statistics/万方数据山东大学硕士学位论文2010年至2014午中文微博发展态势£zzi蚕用户数—·~网民使用率33Q2220i0.1Z2011.Ub201I122012.D62U12.12ZUl5.Ub2U1S.122U14.062014.12图1.12010年至2014年中文微博发展态

8、势谣言是一种特殊的语言现象,同时也是一种古老的社会现象,一直以来是人们关注和研究的热点【2J。美国学者GW.Allport和L.J.Postman认为,谣言是一个“与当时事件相关联的命题,是为了使人相信,一般以口传媒介的方式在人们之间流传,但是却缺乏具体的资料以证实其确切性”[3】。随着新媒体网络的迅速发展,一种融合有新媒体传播特点的独特谣言——网络谣言开始广为流传,它借助先进的信息网络技术,进一步扩大了传播渠道和范围,使得其影响力被瞬间放大。南京大学巢乃鹏等认为网络谣言是指“在网络这一特定的环境下,网络使用实体以特定方式传播的,对网民感兴趣的事务、事件或问题的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。