评价主题挖掘及其倾向性识别

评价主题挖掘及其倾向性识别

ID:5273703

大小:713.29 KB

页数:5页

时间:2017-12-07

评价主题挖掘及其倾向性识别_第1页
评价主题挖掘及其倾向性识别_第2页
评价主题挖掘及其倾向性识别_第3页
评价主题挖掘及其倾向性识别_第4页
评价主题挖掘及其倾向性识别_第5页
资源描述:

《评价主题挖掘及其倾向性识别》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、万方数据第39卷第6期计算机科学V01.39No.62012年6月ComputerScienceJune2012评价主题挖掘及其倾向性识别李芳1’3何婷婷2‘3宋乐2’3(华中师范大学国家数字化学习工程技术研究中心武汉430079)1(华中师范大学计算机科学系武汉430079)2(国家语言资源监测与研究中心网络媒体分中心武汉430079)3摘要主要研究如何从在线评论文本中挖掘产品的评价主题,并对其倾向性进行分析。首先采用一种启发式规则和共现概率统计相结合的方法识别文本集合中的名词性短语。再运用L【)A模型挖掘潜在的评价主题。然后利用多特征融合的方法计算句子的倾向性。进而根据特征词群统计

2、出各主题的倾向性结果。最后通过时网络汽车评论文本语料的实验证实了该方法的有效性。关键词U)A,评价主题,倾向性识别中图法分类号TP391.3文献标识码A.OpinionTopicMiningandOrientationIdentificationLIFan91’3HETing-tin92’3SONGLe2’3(NationalEngineeringResearchCenterfOrE-leaming,HuazhongNormalUniversity,Wuhan430079,China)1(DepartmentofComputerScience,HnazhongNormalUnivers

3、ity,Wuran430079,China)2(NetworkMediaBranch,NationalLanguageResourcesMonitoringandResearchCenter,Wuhan430079,China)3AbstractThepapermainlyfocusedattention012howtomilleopiniontopicfromonlinesubjectivetextset,andidemi—fiedtheorientationoftheseopiniontopics.Itcombinedtheheuristicruleandco-occurrence

4、probabilitytoidentifyareanounphrase,andadoptedLatentDifichletAllocationn(LDA)toobtainlocalopiniontopic.Then,itcomputedthesen-tcrlceorientationwithamethod0fmultiplefeaturesfusion,andobtainedtheopiniontopicorientationbyaddingupthenumberofeachorientationofthesentencesbelongingtOthespecifiedtopic.Ex

5、perimentalresultsshowthatthemethodcartidemifythetopicandtheirorientationeffectively.KeywordsLDA,Opiniontopic,Orientationidentification1引言随着Internet的普及和发展,互联网商务化程度迅速提高,网络购物占整个互联网应用的33.8%L“,互联网中人们对事物的评价信息已成为驱动消费者购买、促进产品更新升级等的重要因素。然而,快速增长的在线评论网站和急速膨胀的评价信息使得我们面临着信息爆炸却知识匮乏的窘境。人们往往需要花费大量的时间浏览很多相关网站,在过

6、滤掉大量无用信息之后,才能得到较全面的有价值的评价信息。在这一背景下.意见挖掘技术成为了当前自然语言文本处理领域的研究热点,其主要目的就足挖掘并分析主观评论性交本中对人物、产品、传媒等事物的观点和看法。意见挖掘的主要任务[23包括:(1)评价对象抽取;(2)倾向性分析;(3)意见持有者的识别;(4)陈述的选择。目前国内外的研究重点主要是评价对象抽取和倾向性分析。评价对象抽取的任务是找出文本中的评价主体对象或主体属性.所采用的方法主要有两种:一是基于规则抽取的统计方法,这类方法首先采用搭配规则[3·或关联规则[4_来挖掘出候选特征术语,然后利用混合语言模型∞J或者共现概率等统计学方法最终

7、确定描述评价对象的名词。另一种则是采用句法分析的方法。通过名词与极性词在句法结构上的修饰关系来确定评价对象一“。。倾向性分析主要包括词语级、句子级、篇章级的倾向性识别。词语级的倾向性识别主要采用与种子词的共现概率统计L73或基于现存语义知识库(如WordNetc“、HowNetCgJ等)两种分析策略.它是句子级和篇章级倾向性识别的基础。句子级和篇章级的倾向性识别多采用有指导的多特征融合的机器学习方法,比如朴素贝叶斯、最大熵和支持向量机等经典分到

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。