中文微博细粒度情绪识别研究

中文微博细粒度情绪识别研究

ID:45763419

大小:744.84 KB

页数:66页

时间:2019-11-17

中文微博细粒度情绪识别研究_第1页
中文微博细粒度情绪识别研究_第2页
中文微博细粒度情绪识别研究_第3页
中文微博细粒度情绪识别研究_第4页
中文微博细粒度情绪识别研究_第5页
资源描述:

《中文微博细粒度情绪识别研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、摘耍IABSTRACTIll插图索引VI附表索引VII第一章绪论11.1研究背景和研究意义11.2微博简介21.3研究现状31.4主要研究内容61・5论文组织结构7第二章相关理论与技术82.1文本预处理82.1.1中文分词82.1.2词性标注92.2特征选择算法102.2.1词频102.2.2卡方检验112.3.1欧氏距离112.3.2余弦距离122.3.3皮尔逊距离132.4文本分类算法132.4.1朴素贝叶斯分类器NB142.4.2K-最近邻分类器KNN152.4.3支持向量机SVM152.5大连理工情感词汇本体172.6本章小结18

2、第三章多策略中文微博细粒度情绪分析203.1中文微博情感特征203.1.1情感词特征203.1.2词性特征203.1.3表情符213.2中文微博细粒度情绪分析框架213.3中文微博语料预处理222.3.1构建自定义情绪词典221.3.2自定义停用词典233.3.3分词与词性标注233.4中文微博有无情绪分类243.4.1词特征和词性特征选择243.4.2基于迭代的朴素贝叶斯有无情绪分类263.5中文微博细粒度情绪分析303.5.1细粒度情绪特征表示及权值计算303.5.2基于支持向量机的细粒度情绪分析333.5.3基于K-最近邻的细粒度情

3、绪分析343・6本章小结36第四章实验结果与分析374.1实验语料与实验环境374.1.1实验语料374.1.2实验环境384.2实验设计与分析404.2.1基于迭代的朴素贝叶斯算法效果404.2.2特征权重a对实验结果的影响411.2.3SVM惩罚因子c对分类性能的影响414.2.4KNN中距离度量和K值对分类性能的影响422.2.5多策略情绪识别结果434.3本章小结46第五章总结与展望475.1本文的主要工作475.2今后研究工作展望48参考文献49成果目录53致谢54从本世纪初,文木情感研究逐渐成为信息抽取领域中的研究热点,获得了

4、越来越多的关注。特别是Web2.0技术的逐渐普及,微博因为消息简短、发布便捷、实时交互等特点获得了网民极高的喜爱度,广大网民已经从过去单纯的信息获取者变成网络内容的主要制造者。同吋,随着自然语言处理和机器学习技术的不断进步和成熟,对微博这种主观性短文本进行情感分析也成为可能,并逐渐得到广泛应用。针对中文微博的情感分析研究,国内目前主要集中在微博的情感极性判断上,如分析微博表达是积极还是消极,此类硏究已经取得了一定成绩并开始广泛应用,然而,随着应用的深入,用户希望能够获取到微博表达的更细致的情感以便了解用户对某些事物的态度,此时传统的微博情

5、感分析研究方法已很难完全满足需求,虽然目前国内近年来对中文微博细粒度情绪识别正在做一些尝试与努力,但效果并不大理想。因此,本文研究了基于屮文微博的细粒度情绪分析方法,通过探索新的研究思路和方法,进一步提高情感分析的准确性和实用性。文本主要针对中文微博的细粒度情绪识别中的关键技术展开研究。分析了中文微博研究难点和微博情感表达特征,提岀了一种基于情感词汇本体的多策略集成分析法。首先在对微博的有无情绪分类中,在有大量测试集合的前提下,我们提出了基于迭代的朴素贝叶斯分类算法,对该算法分类为有情绪的微博文本,我们进一步的分析它所表达的细腻情绪(an

6、ger愤怒、disgust厌恶、fear恐惧、happiness高兴、like喜好、sadness悲伤、surprise惊讶),使用新颖的文本特征向量表示和权重计算方法量化有情绪微博文本,然后基于支持向量基SVM和K・最近邻KNN算法分别进行7类细粒度情绪分类,实现对中文微博的细粒度情绪分析。最后我们以新浪微傅为实验数据,在大连理工情感词汇木体基础之上,构建多策略融合分类算法与单一分类算法对比实验,最终实验结果表明,多策略分类算法融合方案在细粒度情绪分析研究中效果更好。口在两类多策略融合分析方法屮,“NB&KNN”方案比“NB&SVM”方

7、案稍显优势。论文的主要贡献在于:1)提出了基于迭代的朴素贝叶斯分类算法,该算法在先验知识不足的情况下能很好的提升分类性能。2)扩展丰富了大连理工情感木体库,这将对细粒度情绪识别准确度的提升有很大帮助。3)研究出中文微博文本新颖的特征向量表示法和权重量化方法。该方法能有效降低数据维数灾难,减小算法计算复杂度并最终提高算法性能。4)实现了多策略分类算法融合的细粒度情绪分析方法。该多分类算法融合方案比直接使用单一的算法效果有显著提高,为今后的更深入细粒度情绪分析工作提供了思路和理论依据。通过对中文微博进行细粒度情绪识别分析研究,将为推动电子商务

8、发展,组织机关民意调查,网络舆情监控等提供重要的决策依据。但细粒度情绪分析的准确度依然有很大的改进空间。关键词:细粒度情绪识别;多策略融合方法;中文微博;NB;SVM;KNNResearcho

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。