基于情绪词典扩展技术的中文微博情绪分析

基于情绪词典扩展技术的中文微博情绪分析

ID:34018208

大小:1.02 MB

页数:73页

时间:2019-03-03

基于情绪词典扩展技术的中文微博情绪分析_第1页
基于情绪词典扩展技术的中文微博情绪分析_第2页
基于情绪词典扩展技术的中文微博情绪分析_第3页
基于情绪词典扩展技术的中文微博情绪分析_第4页
基于情绪词典扩展技术的中文微博情绪分析_第5页
资源描述:

《基于情绪词典扩展技术的中文微博情绪分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、南京航空航天大学硕士学位论文摘要随着微博等社交媒体在人们生活中的普及,微博对人们的生活和工作产生了很大的影响。因此,微博情绪分析也成为自然语言处理的一个研究热点。现阶段中文微博的情绪分析正处起步阶段,情绪词典是微博情绪分析的重要资源。但现有情绪词典地构建还不够健全,这是造成中文微博情绪分析准确率较低的重要原因之一。因此,本文提出了一种基于词典扩展技术的微博情绪分析,通过在特定语料中对现有情绪词典进行情绪词的扩展和情绪权重的标注,实现对现有情绪词典的扩展,并利用扩展后的情绪词典对该语料进行情绪分析。首先,本文提出了一种情绪词识别的

2、方法,该方法主要是识别语料中未被情绪词典收录,却表达了情绪的词语。利用情绪词典中情绪色彩鲜明的情绪词作为种子情绪词,通过考察候选词与种子情绪词在语料中的相似性来识别候选词中的情绪词。利用识别出的情绪词扩展现有的情绪词典,并使用无监督的规则方法和有监督的支持向量机(SVM)方法进行微博情绪分析。将实验结果与原情绪词典的实验结果进行对比,结果表明,情绪词地扩展有效地改善了词典对微博的覆盖率,并显著地提高了微博情绪分析的准确率。其次,本文对语料中的情绪词进行了加权处理。通过考察情绪词在语料中与各情绪类的共现模式判断情绪词在语料中对情绪

3、的激励程度,利用情绪词对情绪激励程度的差别对情绪词进行加权。实验结果表明,与词典中标注的情绪强度相比,该方法计算的情绪词权重更准确地表示了该词在语料中对情绪表达的作用,有效地提高了微博情绪分析的精度。并且该方法可以有效的综合多个情绪词典的优势,更进一步地提高微博情绪分析的准确率。最后,本文综合了前面两个工作的优势进行了情绪词典扩展。结合种子情绪词的情绪权重进行情绪词的识别,并根据种子情绪词的情绪权重对识别出的情绪词进行了加权处理。使用所生成的情绪词典,利用无监督的规则方法和有监督的支持向量机(SVM)方法进行微博情绪分析,并将实

4、验结果与现有词典以及未加权的语料情绪词进行比较,结果表明,该方法扩展的情绪词典中情绪词具有更鲜明的情绪倾向,进一步提高了微博情绪分析的准确率。关键词:情绪词典,语料情绪词,情绪强度,情绪向量,相似度计算i基于情绪词典扩展技术的微博情绪分析ABSTRACTWiththepopularityofsocialmediasuchasmicro-bloginpeople'slife,micro-blogproducedgreatinfluenceonpeople'slifeandwork.Therefore,micro-blogsenti

5、mentanalysishasbecomeanimportantresearchinNaturalLanguageProcessing.AutomaticanalysisoftheemotionalcontentinChinesemicro-blogisatthestageofbeginning,emotionaldictionaryisanimportantresourcemicro-blogemotionalanalysis.Buttheemotionaldictionaryconstructionisstillnotper

6、fect,thisisoneoftheimportantreasonsoflowaccuracyoftheChinesemicro-blogemotionalanalysis.Thispaperpropsesamethodtoidentifyemotionsinmicro-blogtextonthetechnologyoftheextendeddictionary.Insomecorpus,emotionaldictionaryisextendedbyaddingnewemotionawordsandannotatingemot

7、ionalintensityforeachemotionalwords.Identifysixemotionsinmicro-blogtextbyextendedemotionaldictionary.Firstly,thispaperproposesamethodtoexploitemotionalwords.Themethodistodetectemotionalwords,whicharenotintheexistingemotionlexiconsbutexpressemotionsinthecorpus.Inorder

8、todetectemotionalwordsandidentifytheemotionaworddenotesinacorpus,wemakeuseofasetofseedemotionalwordsandinvestigatethesimilaritybetw

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。