欢迎来到天天文库
浏览记录
ID:53762083
大小:900.01 KB
页数:9页
时间:2020-04-24
《基于带汇点流形的面向属性抽取式观点摘要-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第28卷第4期中文信息学报Vo1.28,No.42014年7月JOURNALOFCHINESEINFORMATIONPROCESSINGJu1.,2014文章编号:1003—0077(2014)04—0084—08基于带汇点流形的面向属性抽取式观点摘要徐学可,谭松波,刘悦,程学旗(1.中国科学院计算技术研究所,北京100190;2.中国科学院大学,北京100190)摘要:该文研究面向在线顾客点评的面向属性抽取式观点摘要问题。传统方法主要考虑如何抽取属性相关观点,该文提出进一步考虑观点的富含信息(inform
2、ativeness)、重要性(salience)及多样性(diversity)这三方面要求。该文提出了一个基于带汇点的流形排序的一体化的摘要抽取模型,在一体化的流形排序过程中同时考虑三方面要求。在餐馆点评数据上的实验表明了所提出三方面要求的合理性及摘要抽取模型的有效性。关键词:在线顾客点评;面向属性抽取式观点摘要;带汇点的流形排序;属性观点联合模型。中图分类号:TP391文献标识码:AAspect-basedExtractiveOpinionSummarizationByManifoldRankingwit
3、hSinkPointsXUXueke,TANSongbo,LIUYue,CHENGXueqi(1.InstituteofComputingTechnology,ChineseAcademyofSciences,Beiiing100190,China;2.UniversityofChineseAcademicofSciences,Beijing100190,China)Abstract:Inthisposter,weconsidertheproblemofaspect-basedextractiveopini
4、onsummarizationofonlinere—views.InadditiortOextractingaspect—relevantopinionsasmostexistingapproachdo,weproposetofurtherconsid—ertherequirementsofinformativeness,salience,anddiversityinordertOgenerateahigh—qualitysummary.Wepro—posedaunifiedsummaryextractin
5、gframeworkbasedonmanifoldrankingwithsinkpointstOaddressthethreepro—posedrequirementsinaunifiedrankingprocess.Experimentswithrestaurantreviewsshowthereason—abilityoftheproposedrequirementsandeffectivenessoftheproposedapproach.Keywords:onlinereviews;aspect-b
6、asedextractiveopinionsummarization;manifoldrankingwithsinkpoints;JointAspect/Opinionmodel取少量观点句子,用以传达点评中顾客对该属性的引言主要观点信息。相对于传统的摘要形式,该任务可以按照实体的属性信息把摘要组织成结构化形式,观点摘要技术帮助人们快速、高效地把握海量从而方便用户定位感兴趣属性的观点信息,同时帮顾客点评中的主要观点信息。传统的观点摘要技术助用户更深刻、全面地了解实体。往往从点评数据中抽取扁平式的观点句子列表
7、作为总体而言,目前大部分方法_2]主要考虑句子本摘要[i],来传达点评中的重要观点信息。然而,顾客身的局部性信息,例如,是否包含属性相关观点及观通常针对评论实体的特定属性(aspect)(例如,餐馆点的强度等,来孤立地选择句子作为摘要,没有充分的环境、服务等)发表观点;同时,不同的用户也关注考虑到点评集中候选句子间观点相似性的全局性信不同的属性。因此,观点摘要技术应该深入到属性息、摘要结果中旬子间的观点差异性要求。同时,观层次。本文中,我们研究面向属性的抽取式观点摘点的识别也往往基于一个通用观点词典。针对现
8、有要,该任务针对特定属性,从给定实体的点评集中抽方法不足,我们提出1)利用属性相关观点词知识来收稿日期:2013—02—06定稿日期:2013—04—20基金项目:国家自然科学基金(61232010、60933005、60903139、61202215及61100083);国家242信息安全计划课题(2011F65);国家信息安全测评中心项目(Z1277)。4期徐学可等:基于带汇点流形的面向属性抽取式观点摘要85
此文档下载收益归作者所有