中文文本情感分析综述

中文文本情感分析综述

ID:39560938

大小:184.19 KB

页数:3页

时间:2019-07-06

中文文本情感分析综述_第1页
中文文本情感分析综述_第2页
中文文本情感分析综述_第3页
资源描述:

《中文文本情感分析综述》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第31卷第12期计算机应用Vol.31No.122011年12月JournalofComputerApplicationsDec.2011文章编号:1001-9081(2011)12-3321-03doi:10.3724/SP.J.1087.2011.03321中文文本情感分析综述1,211魏韡,向阳,陈千(1.同济大学电子与信息工程学院,上海201804;2.井冈山大学电子与信息工程学院,江西吉安343009)(weiweihzkd@163.com)摘要:由于主观性文本有很多应用价值,情感分析近年来引起了很多研究人员的兴趣。情感分析是对主观性文本进行

2、挖掘与分析,获取有用的知识和信息。针对中文文本情感分析的研究现状与进展进行总结。首先按粒度层次,从词语级、语句级、篇章级三个不同粒度层次细致地介绍相关的技术,再按文本的类型,分析了产品评论和新闻评论的研究进展。接着介绍了中文文本情感分析的评测和相关资源,最后总结了中文文本情感分析的研究难点与未来的研究方向。关键词:情感分析;情感极性;中文文本;评测;语料库中图分类号:TP391.1文献标志码:ASurveyonChinesetextsentimentanalysis1,211WEIWei,XIANGYang,CHENQian(1.CollegeofEl

3、ectronicsandInformationEngineering,TongjiUniversity,Shanghai201804,China;2.CollegeofElectronicsandInformationEngineering,JinggangshanUniversity,JianJiangxi343009,China)Abstract:Thesentimentanalysishasarousedtheinterestofmanyresearchersinrecentyears,sincethesubjectivetextsareuse

4、fulformanyapplications.Sentimentanalysisistomineandanalyzethesubjectivetext,aimingtoacquirevaluableknowledgeandinformation.ThispapersurveyedthestatusoftheartofChinesesentimentanalysis.Firstly,thetechniquewasintroducedindetail,accordingtodifferentgranularitylevels,namelyword,sent

5、ence,anddocument;andtheresearchofproductreviewandnewsreviewwerepresentedrespectively.ThenevaluationandcorpusforChinesetextsentimentanalysiswereintroduced.ThedifficultyandtrendofChinesetextsentimentanalysiswereconcludedfinally.Thispaperfocusesonthemajormethodsandkeytechnologiesin

6、thisfield,makingdetailedanalysisandcomparison.Keywords:sentimentanalysis;sentimentpolarity;Chinesetext;evaluation;corpus0引言1不同粒度的中文文本情感分析随着互联网的飞速发展,尤其是Web2.0技术出现后,越1.1词语的情感极性判别来越多的互联网用户从单纯地获取互联网信息向创造互联网判别词语的情感极性是文本情感分析的基础。为了定量信息转变。互联网中的博客、论坛、讨论组出现了大量的由用地判别词语的情感极性,通常用位于区间[-1,1]的某

7、个实户发布的主观性文本。这些主观性文本可以是用户对某个产数作为情感权重表示词语的褒贬程度。通常如果情感权重大品或服务的评论,或者是公众对某个新闻事件或国家政策的于0,则词语为褒义词;情感权重小于0,则词语为贬义词。情感权重的绝对值越大则意味着词语的褒贬程度越大。词语的观点等。潜在的消费者在购买某个产品或服务时获取相关的情感极性判别主要有基于语料库和基于词典两种方法。评论可以提供决策参考,政府部门也可以浏览公众对新闻事基于语料库的方法主要是利用词语之间的连词以及统计件或国家政策的看法来了解舆情。这些主观性文本每天以指特征来判别词语的情感极性。由连词连接的

8、词语的情感极性数级的速度增长,仅靠人工进行分析需要消耗大量的人力和存在某种关联,比如由连词“和

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。