基于SVM的网购评论文本倾向分析研究

基于SVM的网购评论文本倾向分析研究

ID:17455652

大小:4.02 MB

页数:66页

时间:2018-09-01

基于SVM的网购评论文本倾向分析研究_第1页
基于SVM的网购评论文本倾向分析研究_第2页
基于SVM的网购评论文本倾向分析研究_第3页
基于SVM的网购评论文本倾向分析研究_第4页
基于SVM的网购评论文本倾向分析研究_第5页
资源描述:

《基于SVM的网购评论文本倾向分析研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、_灰wf忠夫莩顼士学位论文暮子SVM的网碡评於文本儐向分拆研堯元海霞指导教师:魏延教授专业名称:计算机应用技术研究方向:数据挖掘二〇一八年四月独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研宄工作及取得的研宄成果。除了文中特别加以标注和致谢的地方外,论文中不包含他人已经发表或撰写过的研究成果,也不包含为获得重庆师范太^或其他教育机构的学位或证书而使用过的材料一。与我同工作的同志对本研宄所做的任何贡献均已在论文中作了明确的说明。学位论文作者签名:九為良:i邮年6月曰_签字日期?学位论文版权使用授权书

2、本学位论文作者完全了解重庆师范大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权重庆师范大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。_学位论文作者签名:签字日期:1〇丨8年Z月;1曰重庆师范大学硕士学位论文基于SVM的网购评论文本倾向分析研究硕士研究生:元海霞指导教师:魏延教授学科专业:计算机应用技术所在学院:计算机与信息科学学院重庆师范大学二〇一八年四月AThesisSubmittedtoChongqingNor

3、malUniversityinPartialFulfillmentoftheRequirementfortheDegreeofMasterofScienceResearchonTendencyAnalysisofOnlineShoppingCommentBasedonSVMCandidate:YuanHaixiaSupervisor:Prof.WeiYanMajor:ComputerApplicationTechnologyCollege:CollegeofComputerandInformationScienceChongqingNormalUniversityApril

4、,2018重庆师范大学硕士学位论文中文摘要基于SVM的网购评论文本倾向分析研究摘要随着互联网和web技术的极速发展,各类电商网站迅速崛起,愈来愈多的用户喜欢在这类网站上购物并发表评论,这些评论通常包含重要的应用价值,例如,用户和商家可以根据好评率决定自己的行为。目前网站上的好评率是通过统计用户评分得到的,但是仅仅根据评分判断是不准确的,因为有的评论内容明显是差评,但评分却很高。因此,需要一种对评论内容进行倾向分析的技术,根据评论内容倾向分析结果统计好评率。评论倾向分析的结果,直接影响好评率的统计准确率。通过分析现有倾向分析技术,针对分类准确率较低等问题,本文以现有研究成果为

5、基础,基于SVM对网购评论进行倾向分析,主要研究内容如下:①采用Word2Vec和HowNet结合的方法构建领域情感词典。单独使用Word2Vec和HowNet时很多词无法判断情感倾向,为了构建完备的领域词典,首先基于Word2Vec获取候选词的相近词,根据相近词确定候选词的情感倾向,当用Word2Vec方法无法判断倾向时,则基于HowNet来判断,即通过计算候选词与正反种子词的语义相似度确定情感倾向。为了避免基于SVM倾向分类时大量的人工标注和标注结果受个人因素影响,本文使用基于情感词典的方法构建训练集。首先基于构建的情感词典计算评论的情感值并根据情感值排序,最后选择一定

6、比例的情感值高的评论作为正向训练集,情感值低的评论作为反向训练集。②基于改进TF-IDF算法计算特征权重。因为仅基于TF-IDF算法计算权重时,忽略了特征的极性值对倾向判断的影响,所以本文首先计算特征的极性值,然后把极性值加入TF-IDF计算过程中。③基于加权Word2Vec改进评论文本向量表示。传统的基于加权Word2Vec表示文本向量时,把评论中每个词都作为影响倾向分类的因素,没有重点考虑特征词对倾向分类的影响,所以本文基于加权Word2Vec构建向量时着重考虑特征词对倾向分类的影响,忽略不重要的词,并在向量中加入评论中正反情感词,否定词和程度副词的个数构成最终的文本向

7、量。④采用本文改进方法,通过分析3万条包含味道属性的餐饮评论的正反倾向,根据正反倾向统计好评率和差评率,验证了基于SVM对评论进行倾向分析后,统计好评率和差评率比常用的根据评分统计好评率和差评率准确率高。关键词:倾向分析,SVM,Word2Vec,情感词典,TF-IDFI重庆师范大学硕士学位论文英文摘要ResearchonTendencyAnalysisofOnlineShoppingCommentBasedonSVMABSTRACTTherapiddevelopmentofinternetandwebtechno

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。