欢迎来到天天文库
浏览记录
ID:42033809
大小:1.32 MB
页数:6页
时间:2019-09-05
《基于情感分析的评论挖掘模型研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、信息系统欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟●唐晓波,肖璐(武汉大学信息资源研究中心,湖北武汉430072)*基于情感分析的评论挖掘模型研究摘要:在社会化网络环境下,关于产品的评论成为企业竞争情报分析重要的数据源。这些评论中包含用户对产品各个方面的情感倾向,对其进行情感分析可以帮助商家了解产品的优缺点。针对现有情感分析的不足,本文在构建评论挖掘模型时综合采用了共词分析和基于句法分析的极性传递法。共词分析可定量确定用户关心的产品维度;极性传递算法考虑句子结构特点,在对句子级文本做情感分析时相较传统情感分类算法有更好的分析效果。
2、同时,引入极性值和强度值计算情感词和主题词的情感强度。关键词:情感分析;评论挖掘;共词分析Abstract:Inthesocialnetworkenvironment,productreviewhasbecomeanimportantdatasourceofenterprisecompetitivein-telligenceanalysis.Thesereviewsincludeusers’emotionaltendenciestowardsallaspectsoftheproducts.Sentimentanalysisonthesereviewscanhelpbusiness
3、esunderstandtheadvantagesanddisadvantagesoftheproducts.Consideringthedeficienciesinthecurrentsentimentanalysis,thispaperusesacombinationofco-wordanalysisandsyntaxanalysis-basedpolaritytransferalgorithmtoconstructareviewminingmodel.Co-wordanalysiscanbeusedtoquantitativelydeterminethedimensions
4、oftheproductstheusersconcernabout.Polaritytransferalgorithmtakesthesentencestructuralfeaturesintoaccount,andhasbetteranalysisresultsinsenti-mentanalysisofthesentencetextcomparedwiththetraditionalsentimentclassificationalgorithm.Meanwhile,thepolarityvalueandstrengthvalueareusedtocalculatetheem
5、otionalintensityofthesentimentalwordsandtopicwords.Keywords:sentimentanalysis;reviewmining;co-wordanalysis随着互联网及电子商务的发展,用户可以在网上发布综合WordNet字典与电影领域知识,采用统计分析方法来对自己购买商品的评论,这些评论篇幅短小、表达情感明做情感分析。通过分析句子语法结构来确定主题词与情感显。通过对该类信息进行分析,商家可以了解自己和竞争词之间的最短依存路径,并根据最短依存路径确定依存关对手的不足与优势,从而做出更正确的决策。同时还可以系规则。文献[5]利用
6、互信息确定用户的情感倾向,摆从这些评论中捕获消费者的偏好为未来发展方向的确定提脱对情感词典的依赖,通过在汽车评论数据源上实验证明供数据支持。情感分析就是一种对该类信息进行分析的方了该方法的有效性。法,又称为意见挖掘,指通过自动分析某种商品评论的文目前对于评论信息的情感分析研究取得了一定进展,[1]本内容,发现消费者对该商品的褒贬态度和意见。目但还存在一些问题:①确定产品分析维度时过于主观,一前,采用情感分析方法来挖掘产品评论的研究成果比较般的情感分析都是人工来确定要分析的维度,并没有从评多。例如:文献[2]构建了一个基于情感分析的汽车评论内容出发来挖掘用户关心的维度。②多采用传统
7、分类算论挖掘系统,该系统通过4个独立但有联系的分类模块实法进行情感分类。评论信息属于短文本,有特征词少且稀[6]现情感识别,反复使用朴素贝叶斯分类算法来识别评论文疏的特点,传统分类算法对其作用有限。且有时一条评本中的主题、品牌、属性和情感倾向。在特征选择上采用论里可能包含对产品不同属性的不同情感倾向,传统分类了人工标注与信息增益相结合方式。文献[3]通过建立算法较难对其作区别。③现有的评论情感分析系统较少关语料库和知识树来改进意见挖掘的效果。其中用于情感分注情感强度这一因素,不同
此文档下载收益归作者所有