欢迎来到天天文库
浏览记录
ID:5265826
大小:509.87 KB
页数:7页
时间:2017-12-07
《基于核心句及句法关系的评价对象抽取》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第25卷第3期中文信息学报VoL25,NO.3JOURNALOFCHINESEINFORMATIONPROCESSINGMay,20112011年5月文章编号:1003—0077(2011)03—0023—07基于核心句及句法关系的评价对象抽取张莉。,钱玲飞,许鑫。(1.南京大学信息管理系,江苏南京210008;2.南京大学计算机科学与技术系国家重点实验室,江苏南京210008;3.华东师范大学商学院信息学系,上海200241)摘要:意见挖掘已成为近年来的热点问题,该文针对COAE2009评测中的意见挖掘任务的一项子任务——评价对象抽取进行了研究。首先提出利用核·句进
2、行学习的思想,继而确定了1O种句法关系作为语言特征,将原始句和核心句分别基于词、词性和句法关系利用条件随机场模型进行学习和比较,在后期又利用二次学习的方式进一步提高了抽取性能。实验取得了相对不错的抽取效果,证明我们提出的方法是可行的,且具有一定的应用价值。关键词:意见挖掘;评价对象抽取;核心句;句法关系;条件随机场中图分类号:TP391文献标识码:ACommentTargetExtractionBasedonNuclearSentencesandSyntacticRelationsZHANGLi,QIANLingfei,XUXin。(1.DepartmentofInf
3、ormationManagement,NanjingUniversity,Nanjing,Jiangsu210008,China;2.NationalKeyLahoratory,DepartmentofComputerScienceandTechnology,NanjingUniversity,Nanjing,Jiangsu210008,China;3.DepartmentofInformation,SchoolofBusiness,EastChinaNormalUniversity,Shanghai200241,China)Abstract:()pinionmini
4、nghasbecomeahottopicinrecentyears.Wefocusononeofthesub—tasksofopinionmininginCOAE2009andproposeatheoryoflearningfromnuclearsentences.Tentypesofsyntacticrelationsaredefinedasfeatures,andtheConditionalRandomFields(CRF)modelisappliedtOanalyzeandcomparetheoriginalsentenceagainstthenuclearse
5、ntenceintermsofwords,part—of—speech(POS)andsyntacticrelations.ThentheCRFsre—learningiscarriedouttOfurtherenhancetheextractionperformance.Experimentresultexhibitsmeasurableim—provementandthereforeprovesthefeasibilityandvalueofthismethod.Keywords:opinionmining;commenttargetextraction;nucl
6、earsentences;syntacticrelation;conditionalrandomfje】dS究课题。对于以抽取观点为任务的意见挖掘技术被l引言广泛应用于如电影、数码相机和汽车等领域,抽取结果有利于人们的决策及商家的反馈改进,也有利于随着Internet的迅速发展,人们越来越倾向于舆情监控,具有较大的应用价值。在web上发表自己的观点和评论。相比传统的社Kim和Hovy认为观点(意见)由四个元素组会调查方法,从新闻、产品论坛和博客等网络载体上成l】]:即主题(Topic)、持有者(Holder)、陈述获取评论文本具有方便、快捷和代价小等优点,近年(Cla
7、im)和情感(Sentiment),意见挖掘的主要任务来从主观性文本中抽取观点逐渐成为一个热门的研是从主观文本中找出评价对象及其判断观点的极收稿日期:2010—05—17定稿日期:2010—12-30基金项目:教育部人文社会科学重点研究基地基金资助项目(08JJD870225);江苏省自然科学基金资助项目(BK2009233)作者简介:张莉(1976一),女,博十生,讲师,主要研究方向为数据挖掘,情感分析;钱玲飞(1979一),女,博士生,主要研究方向为数据挖掘,学科评价;许鑫(1976一),男,博士,主要研究方向为网络信息处理与分析。24中文信息学
此文档下载收益归作者所有