基于主题模型的中文情感分类方法研究

基于主题模型的中文情感分类方法研究

ID:35059697

大小:4.59 MB

页数:64页

时间:2019-03-17

基于主题模型的中文情感分类方法研究_第1页
基于主题模型的中文情感分类方法研究_第2页
基于主题模型的中文情感分类方法研究_第3页
基于主题模型的中文情感分类方法研究_第4页
基于主题模型的中文情感分类方法研究_第5页
资源描述:

《基于主题模型的中文情感分类方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文题目:基于主题模型的中文情感分类方法研究研究生李强专业计算机技术指导教师吴铤教授完成日期2016年3月杭州电子科技大学硕士学位论文基于主题模型的中文情感分类方法研究研究生:李强指导教师:吴铤教授2016年3月DissertationSubmittedtoHangzhouDianziUniversityfortheDegreeofMasterTheResearchofChineseSentimentClassificationMethodBasedonTopicModelCandidate:LiQiangSupervisor:Prof.WuT

2、ingMarch,2016杭州电子科技大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明;所呈交的学位论文,是本人在导师的指导下,独立进行研。究工作所取得的成果除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均己在文中W明确方式标明。申请学位论文与资料若有不实之处一,本人承担切相关责任。"论文作者签名:现、日期:年?月/〇H学位论文使用授权说明本人完全了解杭州电子科技大学关于保留巧使用学位论文的规定,即:研巧生在校攻读学

3、位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为杭州电子科技大学。学校有巧保留送交论文的复印件,允许查阅和借阅论文;学校可公布论文的全部或部分内容,可W允许采用影印、缩印或其它复制手段保存论文。(保密论文在解密后遵守此规定)>^?;。/论文作者签名:幸带日期:年月/日■〇日指导教师签名:瓜日期:年3月/摘要随着“互联网+”的互联网形态逐步演化发展,网络正逐渐充斥着人们生活的方方面面,人们越来越多的在网络上表达着自己对事物的看法,从一部电影,一个商品到社会热点事件

4、的评论,主观性文本充斥着整个网络。对这些主观性文本的情感倾向的研究,有利于分析消费者的态度,也可以研究大众的情感变化,有着重大的现实意义。因此自然语言的情感分类问题,一直是文本处理领域的热点问题。情感分类问题有如此重大的理论和现实意义,基于此,本文主要做了以下研究工作。首先,本文详细介绍了研究情感分类问题使用的主要技术,并系统性的阐述了文本表示模型的发展演化过程,从最初的VSM模型到基于潜在语义的LSA模型和PLSA模型,重点介绍了LDA(隐狄利克雷分布)模型,包括该模型的原理、生成过程和参数推导过程,以及其在情感分类中的一些具体应用,可知将LDA模型

5、引入情感分类任务是可行并且有不错的效果。其次,针对LDA模型中主题特征质量有差异的问题,本文提出一种基于主题加权的LDA模型的情感分类方法。介绍了一种基于神经网络获取词向量的方法,以此词向量计算词语相关度,并计算出主题的内部相关度,进而转化为主题维度上的权值,将加权后的文本-主题分布进行训练分类。实验显示,本文方法比经原始LDA模型建模的文本分类效果提升5%,证明本文方法的有效性。最后,本文寻求一种无监督的情感分类方法,以降低人工标注的成本。本文借助HowNet计算词语的情感值,依旧使用LDA模型对语料建模,可以无监督地获取文档-主题分布和主题-词语分

6、布,通过主题下分布概率较高的词语的情感值,计算主题的情感分布,再加上主题加权的算法,进一步计算得到文档的情感分布。整个过程是无监督的,实验显示,本分类方法可以达到不错的效果,且本方法是无监督的,因此本方法有一定的研究意义。关键词:情感分类,主题模型,特征加权,无监督分类,中文信息处理IABSTRACTWiththeevolutionarydevelopmentofthe"Internet+”,allaspectsofpeople'slivingisgraduallyfilledwithnetwork,moreandmorepeopleexpressth

7、eirviewsintheInternet.Subjectivitydocumentsaboutamovie,acommodity,ahottopicofthesocietyandsoonareinundatedwiththeentireInternet.Researchingthesesubjectivedocuments’semotionaltendenciesisofgreatpracticalsignificanceaboutanalyzingconsumers’attitudesandemotionalchangesofthepublic.T

8、hereforesentimentclassificationofnaturallanguag

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。