欢迎来到天天文库
浏览记录
ID:34428350
大小:2.37 MB
页数:80页
时间:2019-03-06
《面向网络评论的细粒度意见挖掘的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代码:10255学号:2161304面向网络评论的细粒度意见挖掘的研究与应用RESEARCHANDAPPLICATIONONMININGFINE-GRAINEDOPINIONFROMWEBCOMMENTS学科专业:控制工程论文作者:胡征指导老师:曾献辉答辩日期:2018年5月31日东华大学学位论文原创性声明本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已明确注明和引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品及成果的内容。论文为本人
2、亲自撰写,我对所写的内容负责,并完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日东华大学学位论文版权使用授权书学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅或借阅。本人授权东华大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密□,在年解密后适用本版权书。本学位论文属于不保密□。学位论文作者签名:指导教师签名:日期:年月日日期:年月日面向网络评论的细粒度意见挖掘
3、的研究与应用面向网络评论的细粒度意见挖掘的研究与应用摘要随着电商平台成为人们日常生活的一部分,商家越来越希望了解用户的需求和关注点以提升服务质量;用户也迫切想知道待购商品的特征属性及其性能表现以购买到满意的产品。电商网站中越来越多的用户评论数据为解决该问题提供了新的思路。在此背景下,本文应用自然语言处理、数据挖掘、计算机编程等理论和技术,开展了面向网络评论的细粒度意见挖掘研究,以获取以往用户的关注点、商品的特征属性评价等细粒度意见数据,为网站经营者和用户提供了有价值的决策参考信息。本文主要针对网络评论的意见内容提取与意见情感倾向
4、挖掘问题进行了深入研究。与一般意见内容挖掘不同,本文提出了对单条评论文本的意见态度词和商品特征词进行同步提取的方法。在此基础上,构建了商品特征词与意见态度词组成的词对集合,实现了利用该词对集合对有效评论的筛选和意见情感的分析挖掘,取得了一定的成果。最后,将研究成果与实际项目结合,开发完成了一类用于电商环境的网络评论细粒度意见挖掘系统。论文的主要研究工作及创新点包括:1.结合网络评论文本的特点及其分析挖掘的具体要求,给出了面向网络评论的细粒度意见挖掘工作的详细流程。深入研究了本文涉及的主要理论知识,包括自然语言处理、文本特征选择、
5、意见情感倾向挖掘等。2.研究了评论文本的意见内容提取方法。提出了对单条评论文本的意见态度词和商品特征词进行细粒度层次的同步提取的方法。通过设计一种半自主的领域情感词典构建方法,提高了意见态度词提取的准确度。提出一种带窗口约束的LDA主题模型,利用意见态度词的位置信息提高对商品特征词提取的准确度,并保证了商品特征词与意见态度词的同步配对。I面向网络评论的细粒度意见挖掘的研究与应用3.对细粒度意见情感挖掘问题进行了建模分析,将其转化为一类多输入单输出的分类决策问题。提出了基于词袋的用户评论文本向量化方法,同时利用DFTF改进算法实现
6、向量降维。针对转化后的问题维数较高且数据稀疏的特点,提出了利用SVM算法实现评论意见情感的评价。通过对模型的验证实验与结果分析,表明SVM算法有较高的预测正确率,取得了满意的结果。4.开发并实现了一类面向网络评论的细粒度意见挖掘系统。给出了系统总体框架与运行流程,探讨了基于MongoDB的数据存储设计。详细介绍了评论收集程序、意见内容提取与挖掘程序、结果可视化展示程序的开发与实现过程,给出了它们的关键技术和最终的程序界面。系统的成功开发与实际运行,充分说明了本文方法的正确性和有效性。关键词:网络评论;意见挖掘;情感分析;支持向量
7、机;主题模型II面向网络评论的细粒度意见挖掘的研究与应用RESEARCHANDAPPLICATIONONMININGFINE-GRAINEDOPINIONFROMWEBCOMMENTSABSTRACTAse-commerceplatformbecomesonepartofpeople'sdailylife,merchantsincreasinglyhopetounderstanduser’sneedsandconcernsinordertoimprovingtheirservicequalityandusersarealsoea
8、gertoknowthecharacteristicsofproductsandtheirperformance.Manyusercommentsexistingonwebprovidenewwayforsolvingthisproblem.Inthiscont
此文档下载收益归作者所有