基于k关联图流分类算法与其在微博情感的分析中的应用

基于k关联图流分类算法与其在微博情感的分析中的应用

ID:32271147

大小:2.77 MB

页数:67页

时间:2019-02-02

基于k关联图流分类算法与其在微博情感的分析中的应用_第1页
基于k关联图流分类算法与其在微博情感的分析中的应用_第2页
基于k关联图流分类算法与其在微博情感的分析中的应用_第3页
基于k关联图流分类算法与其在微博情感的分析中的应用_第4页
基于k关联图流分类算法与其在微博情感的分析中的应用_第5页
资源描述:

《基于k关联图流分类算法与其在微博情感的分析中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、原创性声明本人郑重声明:所星交的学位论文,是本人在导师的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的科研成采。对本文的研究佟出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本入承担。学位论文作者:誉裁坡妇期:捌夸年6月沾日学位论文使用授权声明本入在导师指导下完成豹论文及相关的职务作品,知识产权归属郑州大学。根据郑州大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅翻借阅;本人授权郑州大学可以将本学位论文的全部或部分编入富关数据库进行检索,可以采用

2、影印、缩印或者其他复制手段保存论文和汇编本学位论文。本人离校后发表、使用学位论文或与该学位论文鲞接相关的学术论文或成果时,第一署名单位仍然为郑州大学。保密论文在解密后应遵守此规定。学位论文作者:毒象必.日期;狮洱年5月二6日摘要随着信息黄金时代的到来,人们越来越意识到数据的重要性,而从这些大量的数据中挖掘有用的信息也变得越来越困难。特别是微博的兴起,使得每天产生大量的微博文本数据,而这些微博文本较短,信息量较少,通常被称作短文本流。在这些短文本流中,蕴藏着大量意见资源。比如产品的评论,这些评论对于卖家和买家都很有价值;又如热点事件的评论,这些评论对于政府部门了解人民群众对某些事件的态度也

3、很重要。因此,如何从短文本流中挖掘有用的知识是人们关心的问题,这些需求也促使着数据流挖掘成为近年来研究的热点和难点。本文在总结了一些成熟的数据流分类算法的基础之上,提出了一种基于K关联图的数据流分类算法(K-associatedGraphsBasedClassifier,KGBC),该算法首先把整个数据块表示成一张K关联图,通过K关联图能够表示数据实例之间的相似关系和子图的纯度。然后根据K关联图优化算法对数据块划分的结果去选择基础分类器中与当前待分类的数据块概念相似的基础分类器,最后对这些基础分类器进行集成,使用概念相似度作为基础分类器的权重对测试数据进行分类。该算法不用每当新的数据块来

4、的时候重新训练分类器,从而节省时间。实验表明,KGBC算法具有较好的预测准确率。本文的另一项工作是短文本流中的情感分析。短文本流情感分析关键是如何判别文本消息的情感倾向性,而判别情感倾向性的首要条件是构建一个适合微博文本的情感词词典。因此,本文提出了一种基于依存句法的微博情感词抽取算法,根据微博情感词在依存句法中常出现的位置总结出一些模版,根据模版自动的识别网络上新的情感词。考虑到中文微博表达多元化的特点,本文采用微博文本中的情感词、词性、上下文关系和主题特征等作为情感分类的特征,通过实验对比KGBC算法和传统的情感分类算法,从而验证了KGBC算法在短文本流情感分类的有效性。关键词:微博

5、;数据流:情感分析;K关联图AbstractWiththecomingofthegoldenageofinformation,peoplearebecomingmoreandmoreawareoftheimportanceofdata.However,ithasbecomemoreandmoredifficulttomineusefulinformationfromthemassivedata.especiallybecauseoftheriseofmicro-blog,whichCanproducealargenumberoftextdataeveryday.Thedatawhichi

6、sshortandhaslittleinformationiscalledShortTextStreams.nlerearealotofopinionresources,suchascommentsonproductswhichareimportanttobothsellersandbuyers,commentsonhotissueswhichaleimportantforthegovernmenttoknowtheattitudesofpeople.Therefore,mostpeopleareconcerningabouthowtomineusefulinformationfzomS

7、hortTe)(tStreams.Theserequirementshavealsomadedatastreamminingbecomeahotanddifficultissueinrecentyears.Furthermore,thethesishassummarizedseveraldatastreamclassificationalgorithms.Basedonthepotentialissuesofthosemethods

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。