欢迎来到天天文库
浏览记录
ID:37062598
大小:1.62 MB
页数:82页
时间:2019-05-17
《基于深度学习多模型融合的中文短文本情感分类算法研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、工程硕士学位论文基于深度学习多模型融合的中文短文本情感分类算法研究与实现作者姓名何远生工程领域计算机技术校内指导教师邓辉舫教授校外指导教师古威高级工程师所在学院计算机科学与工程学院论文提交日期2018年3月StudyandImplementationofChineseShortTextEmotionClassificationBasedonMulti-modelFusionofDeepLearningADissertationSubmittedfortheDegreeofMasterCandidat
2、e:HeYuanshengSupervisor:Prof.DENGHuifangSouthChinaUniversityofTechnologyGuangzhou,China分类号:TP3学校代号:10561学号:201521031539华南理工大学硕士学位论文基于深度学习多模型融合的中文短文本情感分类算法研究与实现作者姓名:何远生指导教师姓名、职称:邓辉舫教授申请学位级别:工程硕士工程领域名称:计算机技术论文形式:产品研发工程设计应用研究工程/项目管理调研报告研究方向:自然语言处理论文提
3、交日期:2018年3月1日论文答辩日期:2018年3月20日学位授予单位:华南理工大学学位授予日期:年月日答辩委员会成员:主席:罗笑南教授委员:张军教授、许勇教授、陈伟能教授、蔡宏民教授摘要随着互联网的日益普及,越来越多的用户喜欢在网络媒体上发表观点并进行交流。这些观点和交流通常以载有情感色彩的文本形式呈现,对这些文本的情感进行分析可以帮助提升网络的精准营销、舆情的有效监控等。与英文文本情感分类相比,中文文本情感分类目前在文本情感分类研究中关注较少,并且准确度一般较低。因此,中文短文本情感分类具有较
4、大研究价值。本文通过研究词向量、网络结构、训练方法和损失函数对于深度学习文本分类模型的影响,训练多个深度学习模型,通过模型融合提升中文短文本情感分类的准确度。首先,本文分析词向量对于深度学习文本分类模型准确度的影响,发现深度学习文本分类模型用预训练的词向量可以获得较高的准确度。鉴于textCNN(ConvolutionalNeuralNetwork)网络中最大值池化(Pooling)会丢失重要特征信息,本文对其池化方法进行了改进,得到了K-Max-CNN网络;同时借鉴textCNN网络的特点对DCN
5、N(DynamicCNN)网络进行改进,得到了四种改进的DCNN网络,并通过实验验证:与改进前的网络相比,K-Max-CNN网络和四种改进的DCNN网络均能获得更高的准确度。其次,针对深度学习训练结果不稳定的问题,借鉴递进学习的思路提出“先难后易”的递进学习训练方法,并通过实验验证了这种训练方法可以使训练结果更稳定,并训练得到准确度更高的模型;利用本文改进的焦点损失函数,避免大量的负样本对模型训练的负面影响,使模型训练过程中更加关注重要的样本,从而提升了模型的准确度。最后,利用预训练的词向量和改进的
6、网络模型,并在多类别情感分类的深度学习模型中使用本文改进的焦点损失函数,采用“先难后易”的递进学习训练方法,训练多个深度学习模型,并进行模型融合建立文本分类模型,分别应用于主客观情感、多类别情感和情感极性这三种中文短文本情感分类问题中。实验结果表明本文提出的基于深度学习多模型融合的中文短文本情感分类方法所建立的模型与对比模型中准确度最高的模型相比,准确度分别提升了0.79%、2.85%和2.05%。关键词:中文短文本;情感分类;递进学习;深度学习;焦点损失函数;多模型融合IAbstractWitht
7、heincreasingpopularityoftheInternet,peoplearewillingtoexpresstheirviewsandcommunicatewitheachotherontheInternet.Theyexpresstheirideasintheformoftextscontainingemotions.Analyzingtheemotionsofthesetextsisveryusefulforonlinemarketing,publicopinionmonitori
8、ngandsoon.ComparingwithEnglishtextemotionclassification,theresearchofemotionclassificationofChinesetexthaslessconcern,anditsaccuracyisgenerallylowerthantheaccuracyofEnglishtextemotionclassification.Therefore,itisofgreatresearchvalueforC
此文档下载收益归作者所有