欢迎来到天天文库
浏览记录
ID:35059447
大小:3.56 MB
页数:56页
时间:2019-03-17
《基于上下文语境的中文微博情感分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、r-.-'-'‘..:六?E:—:-a:—。:密级:。分类号_____UDC::单位代码二■''..'''j声\|-!复傲3;赴乂f%巧..%V.^硕壬学位论文-i/*V论文题目;基于上下文语境的中文微博情感分析'户.;卢'f■.-片典身;、1,…..'.V:x../fI,}’'',;i护气■?^/''.%去..‘^学号1320190289T:王恒
2、作者:计算机科学与技术;专化名称:於卢;4 ̄ ̄声;N飞^丫忿/'令--、20巧1605月30日:年Yi1:一占;C_fl'V,/>户^气A!.'■术—,/^"'i妒之..:.1.V/感奔心京-/,I尸1/.It安徽工业大学硕士学位论文论文题目:基于上下文语境的中文微博情感分析ContextbasedSentimentAnalysisonChinesemicro-blogText计算机科学与技术学院作者
3、:王恒学院:指导教师:秦锋单位:安徽工业大学计算机科学与技术学院协助指导教师:郑啸单位:安徽工业大学计算机科学与技术学院论文提交日期:2016年5月30日学位授予单位:安徽工业大学安徽马鞍山243002独创性说明本人郑重声明:所呈交的论文是我个人在导师指导下进行的研究工作及取得研究成果。尽我所知,除了文中特别加标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得安徽工业大学或其他教育机构的学位或证书所使用过的材料一。与我同工作的同志对本研究所做的任何贡献均已在论文中
4、做了明确的说明并表示了谢意。签名.:^曰期;为八二?。关于论文使用授权的说明本人完全了解安徽王业大学有关保留、使用学位论文的规定,艮P:学校有权保留送交论文的复印件,允许论文被查飼和借阅;学校可W公布论文的全部或部分内容,可采用影印、缩印或其他复制手段保存论文,保密的论文在解密后应遵循此规定。签名;1/1导师签名日期:摘要摘要随着互联网以及移动设备和无线网络的普及,类似于微博这样的网络社交平台越来越受到人们的欢迎。快速增长的用户量以及大量的评论消息,使得微博文本的相关研究
5、工作也愈发受到学者们的关注,微博情感分析任务正是其中一项重要的研究课题。人们在微博平台上发表观点和表达情感,这些消息通常口语化严重且含有强烈的个人主观情感色彩。微博消息往往可以反映个人最真实的即时言论,富有极高的商业和研究价值,而微博情感分析的目的就是通过一系列技术手段对微博文本的情感极性加以判断,以获取有价值信息的过程。目前,国外微博情感分析相关研究比较成熟,国内尚属起步阶段,越来越多的人在微博平台上发表观点和表达情感,从而使得对微博情感极性的判断变得越来越重要。传统中文微博情感分析模型没有考虑到微博上下文语
6、境间的联系,并不能非常准确的识别微博情感极性。因此,为了有效利用微博上下文语境间的联系,本文提出一种基于上下文语境的中文微博情感分析模型,该模型考虑了微博消息的上下文语境,将微博情感分析问题看做标签序列学习任务,使用隐马尔可夫支持向量机算法把微博上下文语境融入微博情感分析问题中。实验结果表明,基于隐马尔可夫支持向量机算法的微博情感分析模型较之于基于朴素贝叶斯或支持向量机算法的微博情感分析模型可以更好的分析微博情感极性,其中以隐马尔可夫支持向量机算法搭配基于随机负采样优化方法的Skip-gram文本表示方法的微博
7、情感分析模型表现最优,在使用完整微博数据集实验时,该搭配方法准确率和F1值皆为0.69,而在使用富含上下文语境微博数据集实验时,其准确率为0.71,F1值可以达到0.70。关键词:中文微博情感分析;微博上下文语境;标签序列学习;隐马尔可夫支持向量机算法IAbstractAbstractWiththepopularityoftheInternetandmobiledevicesandwirelessnetworks,socialnetworkservices,suchasthemicro-blog,havebec
8、omemoreandmorepopular.Therapidgrowthofusersandalargenumberofcomments,makingmicro-blogtextresearchworkisalsoincreasinglyconcernedbyscholars,micro-blogemotionalanalysistaskisoneoftheimportantresea
此文档下载收益归作者所有