中文短文本情感倾向性的分析研究

中文短文本情感倾向性的分析研究

ID:32258755

大小:2.53 MB

页数:76页

时间:2019-02-02

中文短文本情感倾向性的分析研究_第1页
中文短文本情感倾向性的分析研究_第2页
中文短文本情感倾向性的分析研究_第3页
中文短文本情感倾向性的分析研究_第4页
中文短文本情感倾向性的分析研究_第5页
资源描述:

《中文短文本情感倾向性的分析研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、CategoryNumber:LevelofSecrecy:SerialNumber:StudentNumber:50100812308Master'sDissertationofChongqingUniversityofTechnologyResearchonChineseShort-TextSentimentAnalysisPostgraduate:SongJingjingSupervisor:Prof.YangWuSpecialty:ComputerAppliedTechnologyResearchDirection:Infor

2、mationRetrievalTrainingUnit:ComputerScienceSchoolThesisDeadline:April10,2013OralDefenseDate:May30,2013重庆理工大学学位论文原创性声明本人郑重声明:所呈交的学位论文是本人在导师的指导下,独立进行研究所取得的成果。除文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果、作品。对本文的研究做出重要贡献的集体和个人,均已在文中以明确方式标明。本人承担本声明的法律后果。作者签名:日期:年月日学位论文使用授权声明本学位

3、论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权重庆理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于(请在以下相应方框内打“√”):1.保密□,在年解密后适用本授权书。2.不保密□。作者签名:日期:年月日导师签名:日期:年月日摘要摘要随着互联网的飞速发展,以网上论坛、微博等形式为主的带有个人情感色彩的言论信息迅速膨胀,这些言论信息多数是人们对网购商品、影视作品

4、、公众人物、热点事件等发表的评论,蕴含着巨大的商业价值和社会价值,分析这些信息具有很大的现实意义。文本情感分析是指通过分析和挖掘文本中的表达情感、观点和立场的主观性信息并判断其情感倾向。它涉及计算机语言学、机器学习、信息检索等众多领域,具有广泛的应用价值。目前针对中文的情感分析仍处于起步阶段,各项技术尚未成熟,情感分析系统由实验走向实用,还有很长的路要走。本文以微博消息为研究对象,针对句子级中文短文本的情感倾向分析进行研究,主要内容涉及以下三个方面。首先,构建了多分类情感词典。通过对情感词的极性分析,提出将情感词分为静态情感词、动态情

5、感词、网络热点词和情感短语四类,并对动态情感词的极性判别方式进行研究。其次,提出了基于规则过滤和机器学习的观点句识别方法。根据微博语言特点,制定观点句和非观点句的过滤规则,并设计了基于上下文滑动窗口的观点句规则匹配算法。然后针对机器学习分类方法中观点句的特征提取方式进行了研究,对观点句的特征选取方式进行了创新,不但抽取了传统信息处理方法中的普通文本特征,还针对微博的自身特点提取了相应的特征。最后,提出了多策略观点句极性判别方法。根据不同的观点句类型,分别采用基于情感词典、基于机器学习和基于依存句法分析三种方法对观点句的情感极性进行判别

6、。其中研究了基于机器学习情感分类方法中褒义句和贬义句的特征选取,提出了基于依存句法分析的情感依存关系对抽取方法和句子情感极性判别方法。实验以提出的情感分析方法为基础,借助中科院分词工具、哈工大依存句法分析工具以及LibSVM工具包,共同构建了文本情感分析处理系统,并以NLP&CC2012评测语料作为测试数据进行了句子级短文本的情感分析。实验结果表明,本文提出的短文本情感分析方法在准确率和召回率方面均比改进前有较大提高。关键词:文本分类;特征提取;微博;情感分析;依存关系IAbstractAbstractWiththerapiddeve

7、lopmentofInternet,onlineforumsandmicroblogprovidepeoplewithabroaderinformationexchangeplatform.Mostoftheinformationisreviewsofonlinecommodity,filmortelevisionworks,publicfigures,andhotevents,whichcontainhugecommercialvaluesandsocialvalues.Toanalyzethisinformationhasagre

8、atpracticalsignificance.Sentimentanalysisoropinionminingreferstotheapplicationofnaturallanguageprocessing,comp

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。