欢迎来到天天文库
浏览记录
ID:32725270
大小:2.43 MB
页数:72页
时间:2019-02-15
《基于类模型的web舆情趋势预测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要分类号密级注1UDC学位论文基于类模型的Web舆情趋势预测(题名和副题名)王沙沙(作者姓名)指导教师傅彦_电子科技大学成都(职务、职称、学位、单位名称及地址)申请学位级别硕士专业名称软件工程论文提交日期2011年3月论文答辩日期2011年5月学位授予单位和日期电子科技大学答辩委员会主席评阅人年月日注1:注明《国际十进分类法UDC》的类号II万方数据独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或
2、证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。签名:日期:年月日关于论文使用授权的说明本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)签名:导师签名:日期:年月日万方数据摘要摘要Web舆情表达快捷、信息多元和方式互动的特点,从根本上改变了传播者与受传者之间的关系,具有
3、传统媒体无法比拟的优势。事件通过网络的快速传播和热烈讨论进而产生一定的舆论压力,负面的舆论,轻则影响企业和政府形象,重则可能引发危机,造成公众对企业和政府的抵制。因此如何提前预测网络舆情的发展趋势去积极化解网络舆论危机显得越来越重要。目前数据挖掘中的趋势分析与预测技术已经在商业、金融、医疗、气象、电信等领域得到了广泛的应用,具体应用如股票交易数据趋势分析、汽车销售的数据挖掘趋势预测、洪水的预报等。在信息网络传输快速的今天,对舆情事件的识别并做出较长一段时间内的趋势预测,这给研究者和工程人员提出了新的挑战。目前需要考虑的主要问题是:如何较快的识别舆情事件并根据有限的信息对该
4、事件做出较为合理的长期趋势预测。为解决此问题,本课题主要通过介绍一个Web舆情的社会网络关系挖掘项目对以下提出的技术和算法进行具体分析和详细介绍并以真实的数据进行了实验来验证其有效性。1、网页信息提取根据指定的URL爬取网页信息和根据项目所需内容从网页中提取相应的信息是本课题web舆情趋势预测的主要前提条件,因此在文本获取和预处理阶段,首先研究了国内外现有的web信息提取技术,在分析了其优缺点的基础上提出了一种基于模糊高斯混合模型的网页信息提取方法。本文提出的方法充分利用了网页的DOM结构,在分析每个路径中标签的均值和方差从而确定提取到的信息内容,在一定程度上减少了人工参
5、与的程度。2、时间序列预测通过研究发现,同类舆情事件的发展趋势具有较高的相似性和明显的周期性,同时针对传统预测方法无法有效预测趋势发展拐点的不足,提出了一种基于类模型的长期趋势预测方法。并且在获取实验数据时,突破了传统的基于内容提取网页主题回复数的方式,提出了另外两种时间序列的获取方式:构建一层社会主题网络,获取相应参数的时间序列;通过Googletrends获取某个事件的时间序列。关键词:网页信息提取、长期趋势预测、时间序列、web舆情、类模型I万方数据ABSTRACTABSTRACTWebpublicsentimentisbetterthanthetraditiona
6、lmedia,its’charactersofquicker,differentdirectionsandinteractivewhenexpressoneeventchangetherelationshipbetweendisseminatorsandacceptorsradically.Ifoneeventwasquicklyspreadandhotlytalked,itwillproducesomecommunitypressures.Especially,ifthiseventisnegative,itwillnotonlyaffectthegovernmenta
7、ndenterprise’simage,butmaybealsotriggercrisis,makethepublicresistthecompanyorgovernment.Soit’sbecomemoreandmoreimportanttoforecastthepublicsentiments’developmenttendencyinadvancesoastodefusethecrisisofwebpublicopinion.Recently,thetrendanalysisandforecastingtechnique
此文档下载收益归作者所有