欢迎来到天天文库
浏览记录
ID:37062118
大小:1.49 MB
页数:50页
时间:2019-05-16
《基于CNN的中文评论情感分类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代码:10126学号:31609103分类号:TP391编号:论文题目基于CNN的中文评论情感分类研究内蒙古大学学院:计算机学院专业:软件工程研究方向:智能信息处理姓名:刘玉茹指导教师:魏宏喜副教授2018年4月25日内蒙古大学硕士学位论文基于CNN的中文评论情感分类研究摘要情感分类是近年来自然语言处理领域的一个研究热点,也是文本挖掘的一个重要分支,受到了越来越多学者的关注与研究。随着各种社交媒体以及电子商务的发展,人们开始在社交网络上发表自己的观点,这些数据成为了重要的互联网资源。在发布的海
2、量文本中有热点事件的评论,有商品或者服务的评论,有电影或者书籍的评论,这些评论中的大多数都带有明显的情感倾向。如何从海量文本中挖掘出带有情绪和喜恶的主观信息,就是情感分类要做的工作,同时在商业领域也有非常广泛的应用前景。近年来,深度学习的兴起使自然语言处理领域的研究得到了突破,卷积神经网络在文本分类中得到了广泛的应用。随着电子商务的普及,网络上出现了越来越多的商品评论信息,传统的方法多为基于情感词典或者机器学习等,这些方法存在数据稀疏的问题,且不能挖掘词与词之间的深层语义关系,本文提出了卷积神经网
3、络模型来解决中文评论情感分类的问题,并引入了Word2vec词向量,将每条评论转化为词向量表示的矩阵输入卷积神经网络中进行情感分类,提高情感分类的准确率。为了对比所设计卷积神经网络的性能,本文采用了长短期记忆神经网络和支持向量机模型作为基线方法。通过对比实验,卷积神经网络分类性能优于两种基线方法。实验结果表明:卷积神经网络能够提取不同维度的特征且性能稳定,能够更好的挖掘出词向量之间隐藏的情感信息;长短期记忆神经网络虽然I基于CNN的中文评论情感分类研究能够保存长期记忆信息,但是在训练过程中会造成重
4、要信息的丢失,所以其性能不如卷积神经网络好;而支持向量机模型忽略了词与词之间的语序及语义信息,导致其性能较差。关键词:情感分类;Word2vec;深度学习;卷积神经网络;长短期记忆神经网络II内蒙古大学硕士学位论文RESEARCHONCHINESESENTIMENTCLASSIFICATIONBASEDONCNNABSTRACTSentimentclassificationisaresearchhotspotinthefieldofnaturallanguageprocessinginrecent
5、years.Itisalsoanimportantbranchoftextdataminingandhasreceivedmoreandmorescholars'attentionandresearch.Withthedevelopmentofvarioussocialmediaande-commerce,peoplebegantoexpresstheiropinionsonsocialnetworks,andthesedatahavebecomeimportantInternetresource
6、s.Therearecommentsabouthoteventsinthemassivetextspublished,reviewsofgoodsorservices,reviewsofmoviesorbooks,andmostofthesecommentshaveobvioussentimenttendencies.Howtoexcavatethesubjectiveinformationwithemotionsandlikesanddislikesfromavastamountoftextis
7、theworkofemotionclassification.Sentimentclassificationiswidelyappliedinproductanalysisandrecommendations.Inrecentyears,theriseofdeeplearninghasmadeabreakthroughinthefieldofnaturallanguageprocessing,andtheconvolutionneuralnetworkhasbeenwidelyusedintext
8、classification.Withthepopularityofe-commerce,moreandmoreappearedonthenetworkinformationcommentsgoods,morethanthetraditionalmethodsfordictionarybasedonemotion,ormachinelearning,etc.,theseproblemsIII基于CNN的中文评论情感分类研究datasparsemethod,andcan'tdigth
此文档下载收益归作者所有