浅论互联网舆情分析关键技术的研究与实现

浅论互联网舆情分析关键技术的研究与实现

ID:35141801

大小:2.82 MB

页数:65页

时间:2019-03-20

浅论互联网舆情分析关键技术的研究与实现_第1页
浅论互联网舆情分析关键技术的研究与实现_第2页
浅论互联网舆情分析关键技术的研究与实现_第3页
浅论互联网舆情分析关键技术的研究与实现_第4页
浅论互联网舆情分析关键技术的研究与实现_第5页
资源描述:

《浅论互联网舆情分析关键技术的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、武汉理工大学硕士学位论文互联网舆情分析关键技术的研究与实现姓名:章栋兵申请学位级别:硕士专业:计算机科学与技术指导教师:徐东平;姚寒冰20100501武汉理.L人学硕十学位论文摘要随着互联网用户爆炸式的增长,受众群体越来越广。在缺乏有效管理的互联网上,对一些敏感案件和突发事件的不实言论和恶意煽动,误导和欺骗了广大人民群众,扩大了人民群众的不满情绪,影响和破坏了社会的和谐稳定。互联网信息的健康程度已引起各级政府的高度重视,有必要对互联网上涉及意识形态安全的议题和言论进行有效地监管。互联网网页每天都以指数级的方式增长,要人工去甄别每个网页所含的信息,并加以分

2、析统计是不现实的。只有采用计算机自动处理技术,使其自动地对互联网舆情进行分析、整理,才能建立起全面、有效、快速的舆情监测预警机制,使互联网得以健康、快速的发展。因此,对互联网舆情的获取与分析技术的研究已成为一项紧迫而又重要的课题。本文对文本的语义倾向性分析这一关键技术进行了深入地研究,通过分析现有语义倾向性识别技术的优缺点,结合隐马尔科夫模型在文本处理方面的良好表现,将本文研究的文本语义倾向性分析方法应用到互联网舆情分析系统中,对舆情信息进行分析,并提供舆情预警功能。文本的语义倾向性分析的目的是判断文本针对评价对象所持有的情感倾向是支持、反对还是中立。由

3、于相似的评论文本,其内容必定有一定的内在联系。互联网舆情信息的表现方式多种多样,本文以网络评论为研究对象,试图将隐马尔科夫模型从已经成功应用的模式识别领域推广到语义倾向性分析系统。与传统倾向性识别系统不同的是,此理论通过建立隐马尔科夫分类模型,将未知文本进行状态序列化,得到文本中所有具有语义倾向的词语所对应的倾向性,然后选定多数词的倾向性来作为文本的总体语义倾向。本文实验系统采用Myeclipse7.O平台的集成开发环境开发,分为语料采集、构建模型和语义识别三个模块。语料采集模块为其它两个模块提供数据支持。构建模型模块将采集得到的数据作为语料进行训练,得

4、到语义识别模型;语义识别模块完成对指定的文本的语义倾向性识别。本文通过对腾讯新闻论坛的数据分别进行封闭测试和开放测试,结果表明,该分析模型可以很好地识别各种未知文本的语义倾向性,并且当训练数据越全面,规模越大时,获得的识别率更高、更稳定。关键词:互联网舆情分析系统,语义倾向性分析,隐马尔科夫模型AbstractMoreaIldmorepeopleareinfluencedbyintenletasthe锄ountotInten】.etuserSincreaLseseXplosively.HoweVer,ifthereisine伍cientm肌agement

5、ofIntenlet,unreaItalkingandmalevolellteXaggerationonsomesellsitiVecasesandemergenclescouldmisleadandcheatpeople,theIl饥largepeople’sunsatisfactory,atlastimpacta11dbreal(thestabilityaJldh锄onyofsoci啊.nefitnessofintenletinfomationhasdrawn孵atattention舶ma111eVelsofgoVenlIIl饥tsaJlditisn

6、eceSsarytoeffectlVelysupeⅣisethetopicsandeXpressionsonideologysafety.ThewebpageonmtemetareinCreaSingeXponentiallyeVe眄dayaIlditisimpossibletoscreellandanal),zealltheinfo彻ationoneachwebpagebymanpower.T1leonlyoptiontoestablishoVerall,e虢ctiveaIldfastmonit嘶ngandearlyw锄ingmechanismofpu

7、blicopinionisthattoadoptautomaticcomputertechnologysothatmeintemetcandeVelopmafastaIldhealthvway.Theref.ore,thestlldyofgainingandallal),zingtechnolog),ofintenletpublic叩inionhasbeen柚urgeIltandimpoTtissue·111ispaperde印lystudiedthekeytechnologyoftextsemantlcon锄tatlon·ltanalvzedthead

8、vantage狃ddisadVantageofpresentsemantIcon

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。