基于多标签新闻语料的阅读者情感分析

基于多标签新闻语料的阅读者情感分析

ID:35063394

大小:5.35 MB

页数:68页

时间:2019-03-17

基于多标签新闻语料的阅读者情感分析_第1页
基于多标签新闻语料的阅读者情感分析_第2页
基于多标签新闻语料的阅读者情感分析_第3页
基于多标签新闻语料的阅读者情感分析_第4页
基于多标签新闻语料的阅读者情感分析_第5页
资源描述:

《基于多标签新闻语料的阅读者情感分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、广东工业大学硕±学位论文(工学硕女)基于多标签新闻语料的關读者情感分析彭晓彬二〇—六年五月分类号:学校代号:118452。1305034UDC:密级:学号:广东工业大学硕壬学位论文(工学硕±)基于多标签新闻语料的阔读者情感分析彭晓彬指导教师姓名、职称:媪零副教授学科(专业)或领域名称:软件工程学生所属学院:计算机学院二〇—六年五月论文答辩日期:ADissertationSubmittedtoGuangdongUniversityofTech

2、nologyfortheDegreeofMasterMasterofEnineerinScience(gg)AnalzityingtheEmotonofheReadersBasedonMu-ltilabelNewsCorpusCandidate:PenXiaobingSupervisor:Prof.WenWenMay2016SchoolofComputerScienceandTechnologyGuangdongUniversityofTech

3、nologyGuangzhou,Guangdong,P.R.China,510006摘要伴随着Web2.0技术的快速发展,许多工具如博客、微博、微信等成为人们日常生活中信息发布与共享的网络平台,每个人可W在网络上分享对某事件的观点、看法,其中也包含了大量的个人意见、主观情感和情绪反馈。基于大规模网络文本一信息的情感分析是舆情分析领域的个重要部分,探究文本信息中所包含群众情绪的动态趋势对于社会学研究有着重要意义。本文的研究主要是阅读者角度的情感分析问题,即通过分析新闻文本中的词语

4、或包含的主题信息,来预测阅读者在读完这篇新闻后可能引发的情绪。在W往的研究中,文本情感分析主要是从作者角度出发探究其中表达的主观情感,对阅读者情一,绪反馈的相关研究相对较少;另方面相关领域通常将文本情感分析问题视为单一一,显然这与实际问标签问题进行处理,即默认篇文档只能引发阅读者的种情绪一题不符,篇新闻对于社会大众引起的情绪可能不尽相同,统计数据思示投票较多一的情感类别般有多个,相关王作大部分是基于词袋模型进行的研究,根据;此外社会也理学研究的观点,阅读者情绪不仅会与新闻文本中直观的词语有关联,还与新

5、闻报道中隐含的事件主题有着间接关系。针对上述问题,本文基于社会大众标注的多标签语料进行了系统化的文本情感分析,主要的工作有W下几个方面:""""(1)多标签新闻语料的构建。针对研究中的着重点多标签、阅读者,将情感分析任务当做多标签分类问题,爬取了社会化标注的新浪社会新闻文本及其读。者投票数据,并对投票数据进行处理(2)分别采用词袋模型和主题模型对多标签新闻语料数据进行实验,并分析了实验结果。从不同角度对数据进行处理,针对二分类、多分类W及多标签分类问题对数据集进行建模,然后训练好模型预测阅读者情感。实验

6、数据表明,在分类性能,上主题模型相对优于词袋模型并且,采用主题模型时文本的特征向量维度远远小于词袋模型,模型代价消耗较小,有着重要的现实意义。3)-LDA(借鉴混合标签的M方法,将情绪标签视为已知标签并将该方法应用LDA是一到文本情绪分类中,。传统的个无监督的主题模型应用在标签分类问题中往往需要结合分类器来进行。为了处理本文的多标签新闻语料,充分利用数据集的一--类别标签,MLDA是种混合了己知类别的有监督主题模型LDA考虑借鉴的。MI广东工ik大学硕击学位论丈在模型的主题层将己知类别与隐含

7、主题进行混合,在模型的建模过程中引入己知类-别信息,最后W权重的大小排序输出标签。实验表明,MLDA模型在单标签多分类问题W及多标签分类问题上表现出良好的性能,特别是对于多标签的读者情绪分类分类,相较于传统的方法在准确率上有较大的提升。:LDA关键词多标签;;主题模型;情感分析IIABSTRACTABSTRACT-mentofWeb2.ilWiththeraiddevelo0asetoftoolssuchasblomcroboandpp,g,gWeGhatha

8、vebecomethe打etworklatformforeoletoreleasea打dshareinformatio打inppptheirdailylife.OntheInternet,everybodyc

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。