欢迎来到天天文库
浏览记录
ID:17455652
大小:4.02 MB
页数:66页
时间:2018-09-01
《基于SVM的网购评论文本倾向分析研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、_灰wf忠夫莩顼士学位论文暮子SVM的网碡评於文本儐向分拆研堯元海霞指导教师:魏延教授专业名称:计算机应用技术研究方向:数据挖掘二〇一八年四月独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研宄工作及取得的研宄成果。除了文中特别加以标注和致谢的地方外,论文中不包含他人已经发表或撰写过的研究成果,也不包含为获得重庆师范太^或其他教育机构的学位或证书而使用过的材料一。与我同工作的同志对本研宄所做的任何贡献均已在论文中作了明确的说明。学位论文作者签名:九為良:i邮年6月曰_签字日期?学位论文版权使用授权书
2、本学位论文作者完全了解重庆师范大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权重庆师范大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。_学位论文作者签名:签字日期:1〇丨8年Z月;1曰重庆师范大学硕士学位论文基于SVM的网购评论文本倾向分析研究硕士研究生:元海霞指导教师:魏延教授学科专业:计算机应用技术所在学院:计算机与信息科学学院重庆师范大学二〇一八年四月AThesisSubmittedtoChongqingNor
3、malUniversityinPartialFulfillmentoftheRequirementfortheDegreeofMasterofScienceResearchonTendencyAnalysisofOnlineShoppingCommentBasedonSVMCandidate:YuanHaixiaSupervisor:Prof.WeiYanMajor:ComputerApplicationTechnologyCollege:CollegeofComputerandInformationScienceChongqingNormalUniversityApril
4、,2018重庆师范大学硕士学位论文中文摘要基于SVM的网购评论文本倾向分析研究摘要随着互联网和web技术的极速发展,各类电商网站迅速崛起,愈来愈多的用户喜欢在这类网站上购物并发表评论,这些评论通常包含重要的应用价值,例如,用户和商家可以根据好评率决定自己的行为。目前网站上的好评率是通过统计用户评分得到的,但是仅仅根据评分判断是不准确的,因为有的评论内容明显是差评,但评分却很高。因此,需要一种对评论内容进行倾向分析的技术,根据评论内容倾向分析结果统计好评率。评论倾向分析的结果,直接影响好评率的统计准确率。通过分析现有倾向分析技术,针对分类准确率较低等问题,本文以现有研究成果为
5、基础,基于SVM对网购评论进行倾向分析,主要研究内容如下:①采用Word2Vec和HowNet结合的方法构建领域情感词典。单独使用Word2Vec和HowNet时很多词无法判断情感倾向,为了构建完备的领域词典,首先基于Word2Vec获取候选词的相近词,根据相近词确定候选词的情感倾向,当用Word2Vec方法无法判断倾向时,则基于HowNet来判断,即通过计算候选词与正反种子词的语义相似度确定情感倾向。为了避免基于SVM倾向分类时大量的人工标注和标注结果受个人因素影响,本文使用基于情感词典的方法构建训练集。首先基于构建的情感词典计算评论的情感值并根据情感值排序,最后选择一定
6、比例的情感值高的评论作为正向训练集,情感值低的评论作为反向训练集。②基于改进TF-IDF算法计算特征权重。因为仅基于TF-IDF算法计算权重时,忽略了特征的极性值对倾向判断的影响,所以本文首先计算特征的极性值,然后把极性值加入TF-IDF计算过程中。③基于加权Word2Vec改进评论文本向量表示。传统的基于加权Word2Vec表示文本向量时,把评论中每个词都作为影响倾向分类的因素,没有重点考虑特征词对倾向分类的影响,所以本文基于加权Word2Vec构建向量时着重考虑特征词对倾向分类的影响,忽略不重要的词,并在向量中加入评论中正反情感词,否定词和程度副词的个数构成最终的文本向
7、量。④采用本文改进方法,通过分析3万条包含味道属性的餐饮评论的正反倾向,根据正反倾向统计好评率和差评率,验证了基于SVM对评论进行倾向分析后,统计好评率和差评率比常用的根据评分统计好评率和差评率准确率高。关键词:倾向分析,SVM,Word2Vec,情感词典,TF-IDFI重庆师范大学硕士学位论文英文摘要ResearchonTendencyAnalysisofOnlineShoppingCommentBasedonSVMABSTRACTTherapiddevelopmentofinternetandwebtechno
此文档下载收益归作者所有