欢迎来到天天文库
浏览记录
ID:37833772
大小:2.26 MB
页数:7页
时间:2019-06-01
《基于深度学习的微博情感分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、万方数据第28卷第5期中文信息学报v01.28,No.52014年9月JOURNALOFCHINESEINFORMATl0NPROCESSINGSep.,2014文章编号:1003—0077(2014)05—0155~07基于深度学习的微博情感分析梁军1,柴玉梅1,原慧斌2,昝红英1,刘铭1(1.郑州大学信息工程学院,河南郑州450001;2.中国核科技信息与经济研究院北京100048)摘要:中文微博情感分析旨在发现用户对热点事件的观点态度。已有的研究大多使用sVM、CRF等传统算法根据手工标注情感特征对微博情感进行分析。该文主要探讨利用深度学习来做中
2、文微博情感分析的可行性,采用递归神经网络来发现与任务相关的特征,避免依赖于具体任务的人工特征设计,并根据句子词语间前后的关联性引入情感极性转移模型加强对文本关联性的捕获。该文提出的方法在性能上与当前采用手工标注情感特征的方法相当,但节省了大量人工标注的工作量。关键词:深度学习;微博情感分析;递归神经网络;自编码中图分类号:TP39l文献标识码:ADeepLeamingforChineseMicro-blogS明timentAn矗lysisLIANGJunl,CHAIYumeil,YUANHuibin2,ZANHongyin91,LIUMin91(1.S
3、choolofInformationEngineering,ZhengzhouUniversity,ZhengzhouHenan,450001,China;2.ChinaInstituteofNuclearInformation&Economics,Be幻ing100048,China)Abstr卵t:Chinesemicro_blogsentimentanalysisaimstodiscovertheuserattitudetowardshotevents.Mostofthecurrentstudiesanalyzethemicro—blogsent
4、imentbytraditionalalgorithmssuchasSVM,CRFbasedonhand—engi—neeredfeatures.ThispaperexploresthefeasibilityofperformingChinesemicro—blogsentimentanalysisbydeeplearning.Wetrytoavoidtask—specificfeatures,anduserecursiveneuralnetworkstodiscoverrelevantfeaturestothetasks.Weprc!poseanov
5、elmodel—sentimentpolaritytransitionmodel一basedontherelationshipbetweenneigh—boringwordsofasentencetostrengthenthetextassociation.Theproposedmethodachievesaperformanceclosetostate—of-the—artmethodsbasedonthehand—engineeredfeatures,butsavingalotofmanualannotationwork.Keywords:deep
6、learning;micro-blogsentimentanalysis;recursiveneuralnetworks;autoencoder1引言随着社交网络的不断发展,人们更愿意通过微博、博客社区来表达自己的观点,发表对热点事件的评论,从而使通过微博、博客、影评以及产品评价等来了解社交网络用户的情感倾向得到了学术界的广泛关注。根据微博数据进行情感分析是一个具有挑战性的任务,近年来引发了学者极大的兴趣uj。目前,情感分析的主要研究方法还是一些基于机器学习的传统算法,例如,SVM、信息熵、CRF等。这些方法归纳起来有3类:有监督学习、无监督学习和半监
7、督学习。而当前大多数基于有监督学习的研究都取得了不错的成绩[2],但是由于有监督学习依赖于大量人工标注的数据,使得基于有监督学习的系统需要付出很高的标注代价。相反的,无监督学习不需要人工标注数据训练模型,是降低标注代价的解决方案,但由于其完全依赖算法学习结果,往往效果不佳,难以达到实际要求。而半监督学习则收稿日期:2014一06—14定稿日期:2014一08—20基金项目:国家自然科学基金(60970083,61272221)、国家社会科学基金(14BYY096)、国家高技术研究发展863计划(2012AA011101)、河南省科技厅科技攻关计划项目(
8、132102210407),河南省科技厅基础研究项目(142300410231,1423004
此文档下载收益归作者所有