欢迎来到天天文库
浏览记录
ID:22981407
大小:2.41 MB
页数:50页
时间:2018-11-02
《基于情感词典的中文微博情感分析研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中山大学硕士学位论文基于情感词典的中文微博情感分析研究ResearchonEmotionalDictionarybasedSentimentAnalysisofChineseMicroBlog专业:软件工程学位申请人:郑毅指导老师:徐亚波答辩委员会主席:委员:二〇一四年五月论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标
2、明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日中山大学硕士学位论文论文题目:基于情感词典的中文微博情感分析研究专业:软件工程硕士生:郑毅指导教师:徐亚波摘要Web2.0时代的到来,改变了传统媒体的传播方式以及人类信息的互动关系,其中微博就是一个很好的例子。越来越多的用户开始在微博上交流观点,分享信息和情感。由于微博写作精炼,发布便捷,实时交流等特点,深得大众喜欢。当下许多用户通过微博这一媒介来抒发自己的心情或发表对于某特定事物的看法,通过对这些信息进行情感分析,可以更好地进行微博营销
3、、舆情监控和品牌调查等。目前中文微博的情感分析研究还处于刚起步阶段。微博情感分析主要是判别微博的情感倾向性,正面还是负面。首先对从网络上抓取的微博进行预处理,之后用半监督的学习方法采样含有特定表情的微博,构成初始训练集。同时结合网络上人工整理的情感字典和常用网络词语,运用点互信息和词向量,结合训练集对词典进行扩展,自动构建一个面向微博的情感字典。之后将微博正文中的情感词作为特征,根据微博自身特点使用SVM训练情感倾向性模型,得出每条微博的情感极性,实现一个面向中文微博的情感倾向性分类系统。实验数据选用新浪微博语料
4、,实验验证了该方法的可行性,最后取得了较好的效果。关键词:微博,情感分析,自然语言处理I中山大学硕士学位论文Title:ResearchonEmotionalDictionarybasedSentimentAnalysisofChineseMicroBlogMajor:SoftwareEngineeringName:ZhengyiSupervisor:XuYaboAbstractThearrivalofWeb2.0era,changingthemodeoftransmissionoftheinteractionb
5、etweentraditionalmediaandhumaninformation,microblogisagoodexample.Moreandmorepeopleareactivelyexpressingtheiropinionsandsharinginformationandfeelingsonmicroblog.Duetoitsbriefwriting,convenientpublishingandreal-timeinteracting,microblogbecomesverypopular.Nowma
6、nyusersthroughmicroblogtoexpresstheirfeelingsorexpresstheirviewsonspecificthings.Analyzingsentimenthiddenintheseinformationcanbenefitmicroblogmarketing,monitoringpublicopinionsandbrandsurvey.Currently,Chinesemicroblogsentimentanalysisisstillattheinitialstage.
7、Sentimentanalysisismainlytoidentifythesentimenttendenciesofmicroblog,classifingusers'ssentimentintopositiveandnegative.Firstly,wecrawlmicroblogfromSinaWeiboandconductsomepreprocessingonthecorpus.Then,useSemi-supervisedapproachestosamplemicroblogcontainingspec
8、ificexpressionandbuildtheinitialtrainingset.Secondly,combiningmanualsentimentdictionaryandcommonlyusednetworkwordsontheweb,weusetheextendedSemanticOrientationPointwiseMutualInformation(SO
此文档下载收益归作者所有