电商评论情感分析关键技术研究.docx

电商评论情感分析关键技术研究.docx

ID:61722639

大小:64.55 KB

页数:2页

时间:2021-03-11

电商评论情感分析关键技术研究.docx_第1页
电商评论情感分析关键技术研究.docx_第2页
资源描述:

《电商评论情感分析关键技术研究.docx》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、电商评论情感分析关键技术研究通过对电商评论进行情感分析挖掘,商家可以及时获知用户需求,了解产品不足之处,及时调整销售策略,因此对商品评论进行情感分析具有巨大的商业价值。然而由于评论文本短小、语言规范性弱、口语化明显、情感语义复杂等特点给情感分析带来了一定的挑战。为了解决这些问题,本文基于电商评论特点,分别从短语资源抽取、情感资源抽取、情感分类技术几个方面进行研究,具体工作如下:1、针对电商评论评价短语资源抽取问题,研究了如何从产品评论中高效抽取评论短语。基于评论中词固定搭配较多的特点,利用改进的逐点互信息(Point-wisemutualinformation,PMI)迭代算法

2、设计出IMEM(IterateMultiwordsexpressionModel)能基于阈值设定自动抽取评论中的高频短语。短语抽取系统,该系统2、针对传统情感词典构建方法的不足之处,提出一种基于统计和规则的情感词典构建方法。该词典构建过程包括基准情感词提取和情感短语提取两部分:(1)针对语言弱规范造成基准情感词难提取问题,提出基于词性(形容词,成语,习用语)过滤和拆分情感短语来高效提取评论中基准情感词;(2)针对基准情感词易受领域依赖性、词上下文依赖性,程度副词和否定词影响的问题,提出基于统计信息和多规则过滤结合来抽取情感短语解决这些问题。并以照相机语料库为研究对象,通过基于

3、情感词典的情感分析方法验证了自定义情感词典的有效性。3、针对基于传统机器学习情感分类情感特征难提取问题,提出一种融合短语和情感权重的词特征优化方法来更好地表示文本语义信息和情感信息;针对传统向量空间模型特征维度高,数据表示稀疏造成机器学习模型训练困难问题,提出基于改进Word2Vec词向量和情感权重的文本表示方法。并通过实验证明了所提出方法的有效性。除此之外,本文还探究了不同词特征权重(词频权重,TF-IDF权重,布尔权重)对情感分类模型的影响。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。