基于web挖掘和文本分析的动态网络舆情预警研究

基于web挖掘和文本分析的动态网络舆情预警研究

ID:23397767

大小:3.24 MB

页数:63页

时间:2018-11-07

基于web挖掘和文本分析的动态网络舆情预警研究_第1页
基于web挖掘和文本分析的动态网络舆情预警研究_第2页
基于web挖掘和文本分析的动态网络舆情预警研究_第3页
基于web挖掘和文本分析的动态网络舆情预警研究_第4页
基于web挖掘和文本分析的动态网络舆情预警研究_第5页
资源描述:

《基于web挖掘和文本分析的动态网络舆情预警研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于挖掘和文本的动(申请工学硕士学位论文)态网基于WEB挖掘和文本分析络舆情预警研究的动态网络舆情预警研究培养单位:计算机科学与技术学院 学科专业:计算机应用技术杨志国研究生:杨志国指导教师:刘东飞教授武汉理工大学2014年4月万方数据分类号学校代码10497UDC学号104972101400学位论文题目基于WEB挖掘和文本分析的动态网络舆情预警研究英文TheResearchofDynamicNetworkPublicOpinionWarning题目BasedonWEBMiningandTextAn

2、alysis研究生姓名杨志国指导教师姓名刘东飞职称教授学位博士单位名称计算机科学与技术学院邮编430070姓名职称学位 副指导教师指单位名称邮编申请学位级别硕士学科专业名称计算机应用技术论文提交日期2014年4月论文答辩日期2014年5月学位授予单位武汉理工大学学位授予日期答辩委员会主席评阅人2014年5月万方数据独创性声明本人声明,所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得

3、武汉理工大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:日期:学位论文使用授权书本人完全了解武汉理工大学有关保留、使用学位论文的规定,即学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权武汉理工大学可以将本学位论文的全部内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存或汇编本学位论文。同时授权经武汉理工大学认可的国家有关机构或论文数据库使用或收录本学位论文,并向

4、社会公众提供信息服务。(保密的论文在解密后应遵守此规定)研究生(签名):导师(签名):日期:万方数据摘要随着互联网的日益普及,网络媒体作为新兴媒体在广大群众,尤其是年轻一代人群中得到迅速推广。人们获得信息的时效性空前提高,由此带来的网络舆情不确定性也大为提高。在此背景下,人们的思想在海量信息的冲击下会产生很大的波动。网络空间容易成为境内外反动势力利用的工具,从而引发社会的动荡,危害国家和社会的稳定。境内外反动势力发起的舆论战,早已蔓延到网络空间,成为日益激烈的主战场。面对网络舆论战,对网络舆情进行研

5、究,及时发现舆情并有针对性的进行预警具有十分重要的意义。本文从WEB挖掘和文本分析两方面,对动态网络舆情预警进行了研究。研究包括了网络舆情的采集、分词、聚类和情感倾向性分析,目的是能够及时发现特定领域内的网络舆情并判断其严重性和发展趋势。本文以WEB挖掘为网络舆情分析的主要方法,提出了网络舆情分析的模型。针对网络舆情特点,通过对WEB文本进行文本分析,计算出文本的情感倾向,从而为网络舆情预警提供依据。本文的主要工作为:1、网络爬虫算法。分析网络舆情首先需要得到网络上的有关数据,需要通过网络爬虫来获取

6、网络数据信息。本文通过分析,结合WEB挖掘,提出以主题爬虫作为网络舆情数据采集的方法,提高了数据采集的准确性。2、文本分词。分词作为文本分析的第一步存在其技术难点:中文分词。本文通过对各种分词方法的比较,结合体现网络舆情的WEB文本特点,引入多字词字典,提出了改进的最大匹配分词法,提高了分词的准确性与效率。3、聚类算法。本文在网络舆情分析中提出通过聚类,先对WEB文本进行初级分类。经过对各种文本聚类算法的比较和分析,针对体现网络舆情的WEB文本所具有的共性特点,通过加入标志文本集,对K-MEANS算

7、法进行了改进,提高了聚类的准确性和效率。4、文本情感倾向性研究。作为对网络舆情的分析最终得出的结论,文本情感倾向性研究有很多方法。本文分析了文本情感倾向性研究的各种方法后,选择了效果较好的朴素贝叶斯分类法,提出了模式匹配与基于属性权重朴素贝叶斯分类器结合的情感倾向性分析方法,提高了情感分类的效率。关键词:网络舆情,WEB挖掘,文本分析,情感倾向性分析I万方数据AbstractThepopularityoftheInternetgrowsfast,andnetworkmediaispromotedra

8、pidly asanewmediainthemasses,especiallyintheyoungergeneration.Timelinessof accesstoinformationisimprovedthanever,anduncertaintyofnetworkpublic opinionisalsoimprovedgreatly.Undertheimpactofthemassive information,people’smindsfluctuategre

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。