基于情感词典的中文微博情感分析研究

基于情感词典的中文微博情感分析研究

ID:22981407

大小:2.41 MB

页数:50页

时间:2018-11-02

基于情感词典的中文微博情感分析研究_第1页
基于情感词典的中文微博情感分析研究_第2页
基于情感词典的中文微博情感分析研究_第3页
基于情感词典的中文微博情感分析研究_第4页
基于情感词典的中文微博情感分析研究_第5页
资源描述:

《基于情感词典的中文微博情感分析研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中山大学硕士学位论文基于情感词典的中文微博情感分析研究ResearchonEmotionalDictionarybasedSentimentAnalysisofChineseMicroBlog专业:软件工程学位申请人:郑毅指导老师:徐亚波答辩委员会主席:委员:二〇一四年五月论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标

2、明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日中山大学硕士学位论文论文题目:基于情感词典的中文微博情感分析研究专业:软件工程硕士生:郑毅指导教师:徐亚波摘要Web2.0时代的到来,改变了传统媒体的传播方式以及人类信息的互动关系,其中微博就是一个很好的例子。越来越多的用户开始在微博上交流观点,分享信息和情感。由于微博写作精炼,发布便捷,实时交流等特点,深得大众喜欢。当下许多用户通过微博这一媒介来抒发自己的心情或发表对于某特定事物的看法,通过对这些信息进行情感分析,可以更好地进行微博营销

3、、舆情监控和品牌调查等。目前中文微博的情感分析研究还处于刚起步阶段。微博情感分析主要是判别微博的情感倾向性,正面还是负面。首先对从网络上抓取的微博进行预处理,之后用半监督的学习方法采样含有特定表情的微博,构成初始训练集。同时结合网络上人工整理的情感字典和常用网络词语,运用点互信息和词向量,结合训练集对词典进行扩展,自动构建一个面向微博的情感字典。之后将微博正文中的情感词作为特征,根据微博自身特点使用SVM训练情感倾向性模型,得出每条微博的情感极性,实现一个面向中文微博的情感倾向性分类系统。实验数据选用新浪微博语料

4、,实验验证了该方法的可行性,最后取得了较好的效果。关键词:微博,情感分析,自然语言处理I中山大学硕士学位论文Title:ResearchonEmotionalDictionarybasedSentimentAnalysisofChineseMicroBlogMajor:SoftwareEngineeringName:ZhengyiSupervisor:XuYaboAbstractThearrivalofWeb2.0era,changingthemodeoftransmissionoftheinteractionb

5、etweentraditionalmediaandhumaninformation,microblogisagoodexample.Moreandmorepeopleareactivelyexpressingtheiropinionsandsharinginformationandfeelingsonmicroblog.Duetoitsbriefwriting,convenientpublishingandreal-timeinteracting,microblogbecomesverypopular.Nowma

6、nyusersthroughmicroblogtoexpresstheirfeelingsorexpresstheirviewsonspecificthings.Analyzingsentimenthiddenintheseinformationcanbenefitmicroblogmarketing,monitoringpublicopinionsandbrandsurvey.Currently,Chinesemicroblogsentimentanalysisisstillattheinitialstage.

7、Sentimentanalysisismainlytoidentifythesentimenttendenciesofmicroblog,classifingusers'ssentimentintopositiveandnegative.Firstly,wecrawlmicroblogfromSinaWeiboandconductsomepreprocessingonthecorpus.Then,useSemi-supervisedapproachestosamplemicroblogcontainingspec

8、ificexpressionandbuildtheinitialtrainingset.Secondly,combiningmanualsentimentdictionaryandcommonlyusednetworkwordsontheweb,weusetheextendedSemanticOrientationPointwiseMutualInformation(SO

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。