基于模板的中文人物评论意见挖掘

基于模板的中文人物评论意见挖掘

ID:5266008

大小:342.81 KB

页数:4页

时间:2017-12-07

基于模板的中文人物评论意见挖掘_第1页
基于模板的中文人物评论意见挖掘_第2页
基于模板的中文人物评论意见挖掘_第3页
基于模板的中文人物评论意见挖掘_第4页
资源描述:

《基于模板的中文人物评论意见挖掘》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第27卷第3期计算机应用研究Vol.27No.32010年3月ApplicationResearchofComputersMar.2010倡基于模板的中文人物评论意见挖掘1,221,21,2李娟,张全,贾宁,臧翰芬(1.中国科学院研究生院,北京100039;2.中国科学院声学研究所,北京100190)摘要:使用基于模板的方法对中文人物评论语句进行意见元素挖掘,提取出句中所含的评价对象、评价词语,并分析出意见的倾向性。进行了中文人物评论语句的自动意见挖掘实验,实验中首先建立了一定数量的熟语料库,然后从语料库中生成意见模板,最后用生成的模板来提取语句的意见元素。实验获得了7

2、2.55%的F唱score,表明该算法是有效的。关键词:意见挖掘;观点抽取;基于模板中图分类号:TP391   文献标志码:A文章编号:1001唱3695(2010)03唱0833唱04doi:10.3969/j.issn.1001唱3695.2010.03.007Pattern唱basedopinionminingonfigurescommentsinChinese1,221,21,2LIJuan,ZHANGQuan,JIANing,ZANGHan唱fen(1.GraduateSchool,ChineseAcademyofSciences,Beijing100039,

3、China;2.InstituteofAcoustics,ChineseAcademyofSciences,Beijing100190,China)Abstract:Usingpattern唱basedmethodtomineopinionsfromChinesefigurescomments,extracttheobject,opinionterms,anddeterminetheorientationoftheopinion.ThispapercarriedouttheexperimenttoautomaticallyminetheopinionsfromChine

4、sefigurescomments.Firstestablishedthetrainingcorpus,thenextractedpatternsfromthecorpus,thenusedthepatternstoex唱tracttheopinionelements.Theexperimentresultof72.55%F唱scoreshowsthatthemethodiseffective.Keywords:opinionmining;opinionextracting;pattern唱based析处理,最后提取出句中的意见信息。从研究涉及的领域来0引言看,现有的意

5、见挖掘都是针对产品,如数码相机、汽车、笔记本电脑等,研究成果对于其他的领域则不适用。此外还有基意见挖掘是近年来自然语言处理领域研究中发展起来的[6]于统计分析的意见挖掘方法、统计分析与语义分析相结合一个新方向,意见挖掘研究的不是文档所谈论的话题,而是它[7]的方法等。所表达的倾向性观点,即肯定/否定或者褒扬/贬损性意见。意考虑到依存语法的分析能力有限,以此为基础进行的意见见挖掘的应用范围很广泛,针对产品的意见挖掘可以帮助用户挖掘也会受到句法分析的限制和影响,因此本文尝试了基于模作出理智的购买决定,针对人物的意见挖掘可以监测舆论倾向板的方法;同时,面向人物的意见挖掘也具有

6、重大的价值,研究或民众意向等。的结果将对舆情监测等社会生活产生较大影响,因此本文选择意见挖掘可以在三个层面上进行,即词语、语句和篇章,[1,2]人物评论语句为对象进行意见挖掘。本文首先建立了人物评如图1所示。词语级的研究可以判断出词语的语义倾向论语料库,并对其中的意见元素进行了标注,构成了熟语料库,性,然后在此基础上可以挖掘语句中的意见元素,也可以判再从熟语料库中提取意见模板,最后用模板提取出未标注的语断篇章的情感倾向。语句级的研究既可以独立应用,也可以句中的意见元素。作为篇章级的研究基础,语句级的研究目标是提取出语句中[3]的意见元素,如评价对象、评价词语、意见倾向等

7、,研究的1算法设计结果可以为人们提供具体而详细的意见内容,也可以提供宏观的结论,具有重要的价值。本文的研究就是提取出语句中1畅1整体设计的意见元素。本文的基于模板的意见挖掘系统分为两大模块,即模板库目前语句级的意见挖掘研究成果较少,已有的语句意见生成模块和意见元素挖掘模块。系统模块如图2所示。挖掘方法主要是对句子进行句法分析,然后在此基础上进一模板库生成模块的目的是将已标注的熟语料库转换为结步挖掘意见信息。比较有代表性的是上海交通大学的娄德成构化的模板库。模块首先从熟语料中提取出包含模板所需信[4,5]等人提出的方法:首先采用依存语法分析

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。