基于svm的产品评论情感分析系统的设计与实现

基于svm的产品评论情感分析系统的设计与实现

ID:31431449

大小:114.50 KB

页数:9页

时间:2019-01-09

基于svm的产品评论情感分析系统的设计与实现_第1页
基于svm的产品评论情感分析系统的设计与实现_第2页
基于svm的产品评论情感分析系统的设计与实现_第3页
基于svm的产品评论情感分析系统的设计与实现_第4页
基于svm的产品评论情感分析系统的设计与实现_第5页
资源描述:

《基于svm的产品评论情感分析系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于SVM的产品评论情感分析系统的设计与实现  摘要:各大电商的产品留言体现了消费者对商品的主观情感,海量的评论信息要用人工来收集和处理是不可能完成的任务,因此需要利用专门的情感分析技术来帮助解决这些问题,文中将属性词词典,情感词词典以及程度词词典和否定词词典作为基础,通过SVM分类法对属性词和程度词的搭配进行识别,以此构造一个产品评论文本分析系统,测试表明系统对产品评论的情感分析具有较高的准确率。  关键词:产品评论;SVM;搭配识别;情感分析  中图分类号:TP393文献标识码:A文章编号:2095-1302

2、(2016)11-00-04  0引言  随着Web技术和电子商务的发展,越来越多的人在各大电商上对自己买过的产品发表评论,这些信息绝大部分代表着发布者的观点或主观情感。商家如果能够得到用户的这些反馈,将有助于商家的下一步生产和销售决策。而其他准备购买该商品的顾客也可以根据这些反馈来更好地帮助自己决定该商品是否值得购买。因此对这些情感信息进行有效的自动分析并构建相应系统成了当今的热门研究问题之一。9  产品评论的挖掘分析主要是基于句子级别的情感分析,其主要任务有识别并获取产品的特征或属性,定位用户的主观性评论,抽

3、取评论搭配,判别用户评论的褒贬[1]。本文构造的系统以属性词词典,情感词词典以及程度词词典和否定词词典为基础,通过SVM分类法对属性词和程度词的搭配进行识别,进而分析评论的褒贬。  1相关研究  Probst等[2]利用监督学习技术抽取属性词―评论词关系对。Yohan等[3]基于LDA模型提出SLDA模型。实验表明,该类方法在抽取产品特征中有一定的效果。栗春亮等[4]利用百度百科和分词后相邻的词语同现比例来识别专业领域内的生词,在中文产品评论语料中设计词性组合模板来得到候选属性词集,然后利用一定的规则对其过滤。Q

4、iu[5]等通过研究评价词和评价对象间的关系模式,提出用一种双向传播算法进行抽取。本文对产品属性词的抽取主要借鉴文献[4]中提到的方法,得到1500个属性词,作为属性词词典。情感词典的构建方式主要有人工和基于词典两种。目前主要使用的词典有董振东和董强编撰的HOWNET情感词典和台湾大学编撰的NTU情感词典。Hassan等[6]使用马尔科夫随机游走模型计算词语的情感权值。柳位平等[7]在中文词语相似度计算方法的基础上提出了一种中文情感词语的情感权值计算方法,并以HOWNET情感词语集为基准,构建了中文基础情感词典。

5、阳爱民等[8]选用若干个情感种子词,利用搜索引擎返回共现数,通过改进的PMI(PointwiseMutualInformation,PMI)算法计算情感词的情感权值。李寿山等[9]借助机器翻译系统,结合双语言资源的约束信息,利用标签传播算法(LP)计算词语的情感信息。本文主要根据文献[8]提出的方法,构建一个在产品评论分析中使用的情感词典,部分词如图1所示。程度词和否定词词典使用王文华等[10]提出的相应词典。9  词集极性情感词  P_set正向著名,好,积极,和谐,青春,成熟,善良,文明,出色,舒服,纯真,得

6、体,美丽,创造力,宽容,昌盛,感激,优秀,美好,灿烂,诚实,给力,帅呆,霸气,淳朴,漂亮,美妙,辉煌  N_set负向罪恶,诅咒,暴殄天物,郁闷,傻逼,变态,惨不忍睹,痛苦,垃圾,失败,委屈,毛病,扭曲,诡异,畸形,悲惨,崩溃,弱爆,狠毒,假冒,水货,粗暴  对属性词和情感词的搭配识别可以看成是一个分类问题,常用到的分类算法包括朴素贝叶斯分类器(NaiveBayesianClassifier)、基于支持向量机(SupportVectorMachine,SVM)的分类器、k-最近邻法(k-NearestNeighb

7、or,kNN)、决策树(decisiontree)分类法、最大熵模型(MaximumEntropy,ME)等,本文使用SVM作为搭配识别的分类器,搭配规则使用文献[10]中提到的8条规则。  2情感分析系统的需求分析和设计目标  2.1需求分析  产品评论情感分析系统用来对电子商务网站上的产品评论进行搜集分析。  (1)该系统首先对某个站点进行页面抓取、内容提取,得到用户对产品的大量评论信息;  (2)进行分词、关键信息抽取;  (3)对这些评论信息进行分析,挖掘出用户对产品各种属性的情感倾向以及对整个产品乃至商

8、家的褒贬倾向;9  (4)将结果进行展示,从而有效辅助希望购买产品的用户进行合理的消费判断,同时也能够帮助产品生产商做下一步生产和销售决策。  根据这些需求,可以对本系统做出如下需求分析:  (1)能够抓取产品评论页面并能对页面中的评论内容进行提取。  (2)能够从评论文本中抽取情感信息。  (3)能够有效搭配识别分类。  (4)能够准确进行属性情感极性分析和文本情感的倾

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。