欢迎来到天天文库
浏览记录
ID:50448043
大小:2.69 MB
页数:66页
时间:2020-03-06
《电商网站的产品评价对象抽取研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、电商网站的产品评价对象抽取研究刘沙2015年1月中图分类号:TP391.1UDC分类号:681.37电商网站的产品评价对象抽取研究作者姓名刘沙学院名称计算机学院指导教师牛振东教授答辩委员会主席樊孝忠教授申请学位工学硕士学科专业计算机科学与技术学位授予单位北京理工大学论文答辩日期2015年1月ResearchofProductOpinionTargetsExtractionfromWebsitesofe-CommerceCandidateName:LiuShaSchoolorDepartment:SchoolofComputerScienceFacultyMentor:Pr
2、of.NiuZhendongChair,ThesisCommittee:Prof.FanXiaozhongDegreeApplied:MasterofEngineeringMajor:ComputerScienceandTechnologyDegreeby:BeijingInstituteofTechnologyTheDateofDefense:January,2015研究成果声明本人郑重声明:所提交的学位论文是我本人在指导教师的指导下进行的研究工作获得的研究成果。尽我所知,文中除特别标注和致谢的地方外,学位论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京
3、理工大学或其它教育机构的学位或证书所使用过的材料。与我一同工作的合作者对此研究工作所做的任何贡献均已在学位论文中作了明确的说明并表示了谢意。特此申明。签名:日期:北京理工大学硕士学位论文摘要随着电子商务的快速发展,互联网中产生了大量的产品评论信息,这些信息真实可靠、内容丰富,能够给购买者提供极有价值的参考和帮助。由于评论信息数据量大,内容不规范,通过人工阅读的方式无法准确而全面地了解产品的情况,因此针对于互联网评论信息的意见挖掘研究应运而生。意见挖掘研究包含主题(即评价对象)抽取、意见持有者识别、陈述选择和情感分析等任务。在电商网站的评论文本中,评价对象抽取侧重于识别产品
4、的属性和特征,是进行情感分析和意见摘要任务的基础,为用户快速了解评论内容提供便利。由于互联网文本的随意性,基于模板和规则的评价对象抽取方法在不规范的评论句中通常无法得到正确的评价对象。此外,一些评价对象由于评价次数少而经常被忽略。针对以上问题,本文提出了一种三层过滤的评价对象抽取方法,采用自扩展的候选评价对象抽取、关联置信度计算以及领域置信度计算三个层次将评价对象词从其他词中分离出来。在第一层算法中,通过一组评价对象种子词在评论文本中抽取候选的评价对象和情感词;在第二层算法中,利用评价对象与情感词之间的关联度对候选词进行关联置信度计算,提取关联置信度高的评价对象以提高识别
5、的准确率;在第三层算法中,引入一个不相关的平行领域对剩余的候选词进行领域置信度计算,挖掘低频的评价对象词。在三个公开数据集上的实验表明,三层过滤的评价对象抽取方法能够显著地提高评价对象的识别效果。关键词:评价对象抽取;情感词;关联置信度;领域置信度I北京理工大学硕士学位论文AbstractAlargenumberofproductreviewsaregeneratedintheInternetwiththerapiddevelopmentofe-commerce.Theinformationisrichincontentandreliablewhichprovidespu
6、rchasersvaluablereferenceandhelp.Useropinioninformationissomuchandnaturalthatartificialreadingcannotgetanaccurateandcomprehensiveunderstandingoftheproducts.SoopinionminingresearchforreviewsfromtheInternetemerged.Opinionminingincludestopicextractionwhichisalsocalledopiniontargetsextraction
7、,holderidentification,claimselection,sentimentanalysis,etc.Opiniontargetsextractionfocusesontheidentificationoftheproductattributesandcharacteristicsfromthereviewsofthee-commercewebsites.Itisthebasicofopinionanalysisandopinionsummarywhichbringsgreatconveniencetouser
此文档下载收益归作者所有