电商网站的产品评价对象抽取研究.pdf

电商网站的产品评价对象抽取研究.pdf

ID:50448043

大小:2.69 MB

页数:66页

时间:2020-03-06

电商网站的产品评价对象抽取研究.pdf_第1页
电商网站的产品评价对象抽取研究.pdf_第2页
电商网站的产品评价对象抽取研究.pdf_第3页
电商网站的产品评价对象抽取研究.pdf_第4页
电商网站的产品评价对象抽取研究.pdf_第5页
资源描述:

《电商网站的产品评价对象抽取研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、电商网站的产品评价对象抽取研究刘沙2015年1月中图分类号:TP391.1UDC分类号:681.37电商网站的产品评价对象抽取研究作者姓名刘沙学院名称计算机学院指导教师牛振东教授答辩委员会主席樊孝忠教授申请学位工学硕士学科专业计算机科学与技术学位授予单位北京理工大学论文答辩日期2015年1月ResearchofProductOpinionTargetsExtractionfromWebsitesofe-CommerceCandidateName:LiuShaSchoolorDepartment:SchoolofComputerScienceFacultyMentor:Pr

2、of.NiuZhendongChair,ThesisCommittee:Prof.FanXiaozhongDegreeApplied:MasterofEngineeringMajor:ComputerScienceandTechnologyDegreeby:BeijingInstituteofTechnologyTheDateofDefense:January,2015研究成果声明本人郑重声明:所提交的学位论文是我本人在指导教师的指导下进行的研究工作获得的研究成果。尽我所知,文中除特别标注和致谢的地方外,学位论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京

3、理工大学或其它教育机构的学位或证书所使用过的材料。与我一同工作的合作者对此研究工作所做的任何贡献均已在学位论文中作了明确的说明并表示了谢意。特此申明。签名:日期:北京理工大学硕士学位论文摘要随着电子商务的快速发展,互联网中产生了大量的产品评论信息,这些信息真实可靠、内容丰富,能够给购买者提供极有价值的参考和帮助。由于评论信息数据量大,内容不规范,通过人工阅读的方式无法准确而全面地了解产品的情况,因此针对于互联网评论信息的意见挖掘研究应运而生。意见挖掘研究包含主题(即评价对象)抽取、意见持有者识别、陈述选择和情感分析等任务。在电商网站的评论文本中,评价对象抽取侧重于识别产品

4、的属性和特征,是进行情感分析和意见摘要任务的基础,为用户快速了解评论内容提供便利。由于互联网文本的随意性,基于模板和规则的评价对象抽取方法在不规范的评论句中通常无法得到正确的评价对象。此外,一些评价对象由于评价次数少而经常被忽略。针对以上问题,本文提出了一种三层过滤的评价对象抽取方法,采用自扩展的候选评价对象抽取、关联置信度计算以及领域置信度计算三个层次将评价对象词从其他词中分离出来。在第一层算法中,通过一组评价对象种子词在评论文本中抽取候选的评价对象和情感词;在第二层算法中,利用评价对象与情感词之间的关联度对候选词进行关联置信度计算,提取关联置信度高的评价对象以提高识别

5、的准确率;在第三层算法中,引入一个不相关的平行领域对剩余的候选词进行领域置信度计算,挖掘低频的评价对象词。在三个公开数据集上的实验表明,三层过滤的评价对象抽取方法能够显著地提高评价对象的识别效果。关键词:评价对象抽取;情感词;关联置信度;领域置信度I北京理工大学硕士学位论文AbstractAlargenumberofproductreviewsaregeneratedintheInternetwiththerapiddevelopmentofe-commerce.Theinformationisrichincontentandreliablewhichprovidespu

6、rchasersvaluablereferenceandhelp.Useropinioninformationissomuchandnaturalthatartificialreadingcannotgetanaccurateandcomprehensiveunderstandingoftheproducts.SoopinionminingresearchforreviewsfromtheInternetemerged.Opinionminingincludestopicextractionwhichisalsocalledopiniontargetsextraction

7、,holderidentification,claimselection,sentimentanalysis,etc.Opiniontargetsextractionfocusesontheidentificationoftheproductattributesandcharacteristicsfromthereviewsofthee-commercewebsites.Itisthebasicofopinionanalysisandopinionsummarywhichbringsgreatconveniencetouser

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。