欢迎来到天天文库
浏览记录
ID:61971421
大小:562.00 KB
页数:13页
时间:2021-04-07
《多策略中文微博细粒度情绪分析研究.ppt》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、多策略中文微博细粒度情绪分析研究南华大学欧阳纯萍2013年11月18日南华大学计算机科学与技术学院任务概述技术要点实验结果总结评测任务微博情绪识别与分类(Close测试):对于输入的整条微博,本任务要求判断出该微博是否包含情绪。对包含情绪的微博,要求判别其情绪分类输出为anger愤怒、disgust厌恶、fear恐惧、happiness高兴、like喜好、sadness悲伤、surprise惊讶中的一种,即单分类输出。任务概述技术要点实验结果总结技术要点技术要点一朴素贝叶斯分类的特征词选择i=0,判断某词在有情绪微博中的表征作用。i=1,判断某词在无情绪
2、微博中的表征作用。对有无情绪微博中的词性特征进行分析,筛选出表征能力强的词性特征。最终,经试验取k=4,n=20,得到了796个特征词和19种词性,组成了815个特征集合。技术要点二面向细粒度情绪的微博向量化α=0.9,β=0.1,w表示属于第m维情感类的总词数,intension表示情感强度,polarity表示情感极性。对卡方检验的特征词进行情感强度和极性人工标注。(参考大连理工本体库)根据计算得到的特征词权重值,对分词后的微博进行向量化。任务概述技术要点实验结果总结实验结果情绪判别实验结果PrecisionRecallF-measureNB+S
3、VM0.66260.80120.7254NB+KNN0.66760.79820.7271MAX0.74940.95170.7271情绪分类宏平均实验结果MacroPrecisionMacroRecallMacroF-measureNB+SVM0.21090.19960.2051NB+KNN0.27040.30640.2873MAX0.28440.30640.2873实验结果情绪分类微平均实验结果MicroPrecisionMicroRecallMicroF-measureNB+SVM0.25390.30700.2779NB+KNN0.31330.37460.
4、3412MAX0.38340.39760.3412任务概述技术要点实验结果总结总结分阶段进行微博情绪分析的方案比较理想。无论是情绪分类还是情绪判别,特征词的选择,微博的特征化都是非常重要的环节。本次实验并未对分类算法进行改进,将是下一步工作的重点。谢谢!南华大学计算机科学与技术学院
此文档下载收益归作者所有