基于三支决策的中文微博文本情感分类研究.pdf

基于三支决策的中文微博文本情感分类研究.pdf

ID:34653381

大小:2.62 MB

页数:62页

时间:2019-03-08

基于三支决策的中文微博文本情感分类研究.pdf_第1页
基于三支决策的中文微博文本情感分类研究.pdf_第2页
基于三支决策的中文微博文本情感分类研究.pdf_第3页
基于三支决策的中文微博文本情感分类研究.pdf_第4页
基于三支决策的中文微博文本情感分类研究.pdf_第5页
资源描述:

《基于三支决策的中文微博文本情感分类研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号TP391密级基于三支决策的中文微博文本情感分类研究研究生姓名:王天吉指导教师姓名、职称:朱艳辉教授学科专业:计算机技术研究方向:自然语言处理湖南工业大学二〇一八年六月二日摘要随着移动互联网的飞速发展,以微博为代表的网络信息交流平台被广泛应用,中文微博文本中蕴含了大量有价值的信息,对它进行情感分类,就可以了解民众对某个事件或者某件产品的态度和看法,微博文本情感分类的结果在消费者研究、市场分析、舆情监控中有着广泛的应用,如何从微博文本中快速地分出正面和负面的情感信息是本文研究的出发点。近年来,用分类技术和NLP技术对微博文本进行情感分类已成为研究的热点,本文以中文

2、微博文本情感分类为主线,提出了基于三支决策的半监督中文微博文本情感分类方法,展开了如下研究工作:(1)对情感特征选择方法和权重计算方法进行了研究。在情感分类中,高维特征会造成冗余,常用的特征选择方法只考虑了情感特征词在类别中的作用而没有考虑它们的情感特性,加上微博文本稀疏、不规则等特性,致使微博文本情感分类的分类效果往往不太理想。为了提高微博文本情感分类的准确率,本文提出了一种基于Z-score的微博文本情感特征选择方法,通过实验来比较采用CHI、VCHI、Z-score特征选择算法进行微博文本情感分类时的分类效果,验证了基于Z-score的微博文本情感特征选择方法的

3、有效性。(2)对主观中文微博文本的分类进行了研究。情感分类中,无监督学习方法往往分类精度很低,监督学习方法必须在标注大量语料的条件下才能够获得理想的分类效果,这要耗费很高的人力成本,半监督学习方法则可以在少量标注语料的情况下充分利用未标注语料信息来提高分类的准确率。本文将三支决策理论引入到微博文本情感分类中,充分利用三支决策在对不确定对象分类时准确率高的优点,结合R-self-training算法在处理语料不平衡问题的优势,提出了一种基于三支决策的半监督微博文本情感分类方法。实验表明,本文提出的方法在标注语料较少的情况下能有效地提高微博文本情感分类的分类效果。关键词:

4、三支决策,情感特征,微博文本,半监督学习,情感分类IABSTRACTWiththerapiddevelopmentofmobileInternet,thenetworkinformationexchangeplatformrepresentedbythemicro-blogiswidelyused.TheChinesemicro-blogtextcontainsalotofvaluableinformation,youcanunderstandthepeople’sattitudesandopinionsaboutaneventoraproductbyclassify

5、ingitemotionally.Theresultofthemicro-blogtextsentimentclassificationisveryimportantandvaluableinconsumerresearch,marketanalysisandpublicopinionmonitoring.Howtoquicklyclassifypositiveandnegativeemotionalinformationfromthemicro-blogtextisthestartingpointofthestudy.Inrecentyears,theuseofcl

6、assificationtechnologyandNLPtechnologyforemotionalclassificationofthemicro-blogtexthasbecomeahottopicofresearch.ThispaperusesthesentimentclassificationofChinesemicro-blogtextasthemainline,andproposesasemi-supervisedmicroblogtextsentimentclassificationmethodbasedonthree-waydecisions,andt

7、heresearchworkisasfollows:(1)Thisarticlestudiestheselectionofemotionalfeaturesandweightcalculationmethods.High-dimensionalfeaturesinsentimentclassificationcancauseredundancy,thecommonlyusedfeatureselectionmethodsonlyconsidertheroleofemotionfeaturewordsinthecategorywithoutconsid

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。