欢迎来到天天文库
浏览记录
ID:50219674
大小:2.18 MB
页数:21页
时间:2020-03-10
《情感分类研究进展.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、计算机研究与发展DOI:10.7544?issn1000-1239.2017.20160807JournalofComputerResearchandDevelopment54(6):1150-1170,2017情感分类研究进展陈龙管子玉何金红彭进业(西北大学信息科学与技术学院西安710127)(longchen@stumail.nwu.edu.cn)ASurveyonSentimentClassificationChenLong,GuanZiyu,HeJinhong,andPengJinye(SchoolofInformationScienceandTechnolog
2、y,NorthwestUniversity,Xian710127)AbstractSentimentanalysisintextisanimportantresearchfieldforintelligentmultimediaunderstanding.Theaimofsentimentclassificationistopredictthesentimentpolarityofopinionatedtext,whichisthecoreofsentimentanalysis.Withrapidgrowthofonlineopinionatedcontent,the
3、traditionalapproachessuchaslexicon-basedmethodsandclassicmachinelearningmethodscannotwellhandlelarge-scalesentimentclassificationproblems.Inrecentyears,deeplearninghasachievedgoodperformanceontheintelligentunderstandingoflarge-scaletextdataandhasattractedalotofattention.Moreandmoreresear
4、chersstarttoaddresstextclassificationproblemswithdeeplearning.Thecontentofthissurveyisorganizedastwoparts.Wefirstlysummarizethetraditionalapproachesincludinglexicon-basedmethods,machinelearningbasedmethods,hybridmethods,methodsbasedonweaklylabeleddataanddeeplearningbasedmethods.Secondly,
5、weintroduceourproposedweakly-superviseddeeplearningframeworktodealwiththedefectsofthepreviousapproaches.Moreover,webrieflysummarizetheresearchworkontheextractionofopinionaspects.Finally,wediscussthechallengesandfutureworkonsentimentclassification.Keywordssentimentanalysis;sentimentclassi
6、fication;deeplearning;weak-supervision;aspectsextraction摘要文本情感分析是多媒体智能理解的重要问题之一.情感分类是情感分析领域的核心问题,旨在解决评论情感极性的自动判断问题.由于互联网评论数据规模与日俱增,传统基于词典的方法和基于机器学习的方法已经不能很好地处理海量评论的情感分类问题.随着近年来深度学习技术的快速发展,其在大规模文本数据的智能理解上表现出了独特的优势,越来越多的研究人员青睐于使用深度学习技术来解决文本分类问题.主要分为2个部分:1)归纳总结传统情感分类技术,包括基于字典的方法、基于机器学习的方法、两
7、者混合方法、基于弱标注信息的方法以及基于深度学习的方法;2)针对前人情感分类方法的不足,详细介绍所提出的面向情感分类问题的弱监督深度学习框架.此外,还介绍了评论主题提取相关的经典工作.最后,总结了情感分类问题的难点和挑战,并对未来的研究工作进行了展望.关键词情感分析;情感分类;深度学习;弱监督;主题提取中图法分类号TP181收稿日期:2016-11-10;修回日期:2017-03-14基金项目:国家自然科学基金优秀青年科学基金项目(61522206)ThisworkwassupportedbytheNationalNaturalScien
此文档下载收益归作者所有