基于hownet和pmi的词语情感极性计算

基于hownet和pmi的词语情感极性计算

ID:33592146

大小:601.22 KB

页数:4页

时间:2019-02-27

基于hownet和pmi的词语情感极性计算_第1页
基于hownet和pmi的词语情感极性计算_第2页
基于hownet和pmi的词语情感极性计算_第3页
基于hownet和pmi的词语情感极性计算_第4页
资源描述:

《基于hownet和pmi的词语情感极性计算》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第38卷第15期计算机工程2012年8月Vol.38No.15ComputerEngineeringAugust2012···人工智能及识别技术·人工智能及识别技术···文章编号:::1000———3428(2012)15———0187———03文献标识码:::A中图分类号:::TP391基于HowNet和和和PMI的词语情感极性计算aba王振宇,,,吴泽,吴泽衡衡衡,,,胡方涛,胡方涛(华南理工大学a.软件学院;b.计算机科学与工程学院,广州510006)摘摘摘要要要:要:::基于语料库的点互信息(PMI)计算方法依赖于语料库的

2、完善性,基于HowNet的计算方法则依赖于知网相似度计算的准确性。为克服2种方法的局限性,提出一种HowNet和PMI相融合的词语极性计算方法,利用知网进行同义词扩展,降低情感词在语料库中出现频率低所带来的问题。实验结果表明,该方法的微平均和宏平均性能比传统方法提升约5%。关键词:::情感分析:;点互信息;知网;同义词扩展;相似度WordsSentimentPolarityCalculationBasedonHowNetandPMIabaWANGZhen-yu,WUZe-heng,HUFang-tao(a.SchoolofSoft

3、ware;b.SchoolofComputerScienceandEngineering,SouthChinaUniversityofTechnology,Guangzhou510006,China)【【【Abstract】】】Thepolaritycalculationofwordlevelisthebasisofsentimentanalysisofsentencelevelanddiscourselevel.ThetraditionalcalculationmethodsbasedonPointMutualInformati

4、on(PMI)orHowNethavetheirowndefects:methodsofPMIdependontheperfectionofthecorpus,andmethodsofHowNetdependonaccuracyofthesimilaritycalculationbasedonHowNet.Inordertoimprovethesedeficiencies,animprovedmethodforcalculatingthepolarityofwordsisproposed,combiningHowNetwithPM

5、I.Firstofall,HowNetisusedtoexpandthesynonymsoftheemotionalwordsinordertoreducetheimpactofsomeemotionalwordswhichhavelowfrequencyinthecorpus,andthen,accordingtothesimilaritycalculationbasedonHowNet,itintegratesthesimilaritybasedonHowNetwiththatofPMI.Experimentalresults

6、showthenewmethodincreasesmicroaverageandmacroaverageby5%comparedwithtraditionalmethods.【【【Keywords】】】sentimentanalysis;PointMutualInformation(PMI);HowNet;synonymexpansion;similarityDOI:10.3969/j.issn.1000-3428.2012.15.0521概述过知网来扩展同义词,然后将知网相似度与PMI计算进行融[7]词语级的情感极性分析是句子级

7、和篇章级的情感极性分合,并进行实验验证。析的基础和前提,它包括2个方面的含义:提取出可能具有2中文词语情感极性计算方法情感倾向的候选词;对该候选词进行分析,判断其倾向性及中文词语常用的情感极性计算方法是基于PMI的计算方极性强度。中文文本的情感词一般以形容词、动词、名词、法和基于知网的计算方法[8]。基于PMI的词语情感极性计算副词为主。词语的情感极性计算主要有2种方法:基于词典方法首先选取一些基准词,这些基准词有代表褒义的,也有[1]的方法和基于语料库的方法。代表贬义的,通过计算新词与这些基准词在语料库中的共现基于词典的方法主要

8、是利用词典中词语之间的相互联系概率,确定新词的褒贬义倾向及强度。来挖掘情感词。英文中常用的方法是计算情感词与种子词在[2]假定基准褒义词为WordSet1={commendatory1,commen-Wordnet中的关联程度来识别出情感词;文献[

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。