欢迎来到天天文库
浏览记录
ID:33592146
大小:601.22 KB
页数:4页
时间:2019-02-27
《基于hownet和pmi的词语情感极性计算》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第38卷第15期计算机工程2012年8月Vol.38No.15ComputerEngineeringAugust2012···人工智能及识别技术·人工智能及识别技术···文章编号:::1000———3428(2012)15———0187———03文献标识码:::A中图分类号:::TP391基于HowNet和和和PMI的词语情感极性计算aba王振宇,,,吴泽,吴泽衡衡衡,,,胡方涛,胡方涛(华南理工大学a.软件学院;b.计算机科学与工程学院,广州510006)摘摘摘要要要:要:::基于语料库的点互信息(PMI)计算方法依赖于语料库的
2、完善性,基于HowNet的计算方法则依赖于知网相似度计算的准确性。为克服2种方法的局限性,提出一种HowNet和PMI相融合的词语极性计算方法,利用知网进行同义词扩展,降低情感词在语料库中出现频率低所带来的问题。实验结果表明,该方法的微平均和宏平均性能比传统方法提升约5%。关键词:::情感分析:;点互信息;知网;同义词扩展;相似度WordsSentimentPolarityCalculationBasedonHowNetandPMIabaWANGZhen-yu,WUZe-heng,HUFang-tao(a.SchoolofSoft
3、ware;b.SchoolofComputerScienceandEngineering,SouthChinaUniversityofTechnology,Guangzhou510006,China)【【【Abstract】】】Thepolaritycalculationofwordlevelisthebasisofsentimentanalysisofsentencelevelanddiscourselevel.ThetraditionalcalculationmethodsbasedonPointMutualInformati
4、on(PMI)orHowNethavetheirowndefects:methodsofPMIdependontheperfectionofthecorpus,andmethodsofHowNetdependonaccuracyofthesimilaritycalculationbasedonHowNet.Inordertoimprovethesedeficiencies,animprovedmethodforcalculatingthepolarityofwordsisproposed,combiningHowNetwithPM
5、I.Firstofall,HowNetisusedtoexpandthesynonymsoftheemotionalwordsinordertoreducetheimpactofsomeemotionalwordswhichhavelowfrequencyinthecorpus,andthen,accordingtothesimilaritycalculationbasedonHowNet,itintegratesthesimilaritybasedonHowNetwiththatofPMI.Experimentalresults
6、showthenewmethodincreasesmicroaverageandmacroaverageby5%comparedwithtraditionalmethods.【【【Keywords】】】sentimentanalysis;PointMutualInformation(PMI);HowNet;synonymexpansion;similarityDOI:10.3969/j.issn.1000-3428.2012.15.0521概述过知网来扩展同义词,然后将知网相似度与PMI计算进行融[7]词语级的情感极性分析是句子级
7、和篇章级的情感极性分合,并进行实验验证。析的基础和前提,它包括2个方面的含义:提取出可能具有2中文词语情感极性计算方法情感倾向的候选词;对该候选词进行分析,判断其倾向性及中文词语常用的情感极性计算方法是基于PMI的计算方极性强度。中文文本的情感词一般以形容词、动词、名词、法和基于知网的计算方法[8]。基于PMI的词语情感极性计算副词为主。词语的情感极性计算主要有2种方法:基于词典方法首先选取一些基准词,这些基准词有代表褒义的,也有[1]的方法和基于语料库的方法。代表贬义的,通过计算新词与这些基准词在语料库中的共现基于词典的方法主要
8、是利用词典中词语之间的相互联系概率,确定新词的褒贬义倾向及强度。来挖掘情感词。英文中常用的方法是计算情感词与种子词在[2]假定基准褒义词为WordSet1={commendatory1,commen-Wordnet中的关联程度来识别出情感词;文献[
此文档下载收益归作者所有