基于主题特征和深度学习的情感分析算法研究

基于主题特征和深度学习的情感分析算法研究

ID:37062833

大小:6.61 MB

页数:64页

时间:2019-05-16

基于主题特征和深度学习的情感分析算法研究_第1页
基于主题特征和深度学习的情感分析算法研究_第2页
基于主题特征和深度学习的情感分析算法研究_第3页
基于主题特征和深度学习的情感分析算法研究_第4页
基于主题特征和深度学习的情感分析算法研究_第5页
资源描述:

《基于主题特征和深度学习的情感分析算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、工程硕士学位论文基于主题特征和深度学习的情感分析算法研究作者姓名郑灶旭工程领域软件工程校内指导教师吴庆耀校外指导教师陈阳所在学院软件学院论文提交日期2018年4月ResearchonSentimentAnalysisBasedonTopicFeatureandDeepLearningADissertationSubmittedfortheDegreeofMasterCandidate:ZhengZaoxuSupervisor:WuQingyao,ChenYangSouthChinaUniversityofTechnologyGuangzhou,China分类

2、号:TP3学校代号:10561学号:201621035147华南理工大学硕士学位论文基于主题特征和深度学习的情感分析算法研究作者姓名:郑灶旭指导教师姓名、职称:吴庆耀副教授、陈阳高级软件工程师申请学位级别:工程硕士工程领域名称:软件工程论文形式:□产品研发□工程设计应用研究□工程/项目管理□调研报告研究方向:自然语言处理论文提交日期:2018年5月18日论文答辩日期:2018年5月21日学位授予单位:华南理工大学学位授予日期:年月日答辩委员会成员:主席:陈健教授委员:吴庆耀副教授、杜卿副教授、陈俊颖副教授、陈阳高级工程师摘要文本是人们获取知识和信息的主要媒

3、介。随着互联网行业的发展,网络上积累了大量新闻、评论、文章等文本数据,通过挖掘和分析这些文本数据中的观点、立场、情绪等主观内容,人们可以迅速提取文本的信息,以便获取经验和做出决策。文本数据的体量急剧增大,从中提取到的特征往往具有高纬度的特点,传统的机器学习算法难以处理如此复杂的数据,只能借助语言规则和词典作为辅助知识。近年来重新兴起的深度学习能够从数据的浅层特征逐步提取出深层的特征,几乎不需要任何辅助知识即可处理高纬度的数据,因此使用深度神经网络的文本分析方法成为主流方法。近年来,多种基于神经网络的文本分析方法被相继提出,文本的情感分析精度不断提高。但是目前

4、的情感分析方法缺乏对文本所在语境的关注。本文关注电影评论的情感二分类任务,提出综合考虑文本特征和主题特征的情感分析方法。本文的主要工作有:(1)本文研究并分析了文本情感分析的基本流程,包括文本预处理、文本表示方法和构建分类模型等。在文本表示时,针对高维度和语义不相关的问题,本文使用word2vec词嵌入的方法将文本单词转化为含有一定语义信息的向量。在构建分类模型的步骤,本文介绍了目前流行的多种神经网络,以及使用它们构建文本分析模型的方法。(2)本文改进了双向GRU神经网络结合的模型。通过向量拼接文本特征和文档级主题特征,构建网络的输入层,且在输入层和GRU层

5、后引入注意力机制。本文在进行情感分析任务时考虑了文档级的主题特征,并通过注意力机制强化网络对有用文本主题特征的关注,弱化对无用特征的关注。实验表明,主题特征的加入和双注意力层的加入都提升了原GRU神经网络模型的性能,本文的模型比起传统的神经网络模型在电影评论分析任务中具有更好的表现。(3)本文从多视角学习的角度,提出了基于文本特征和文本主题特征的协同训练方法。分别使用CNN和本文改进的GRU模型作为系统训练的两个分类器。本文的方法是一个半监督学习方法,对标注数据的依赖较低。实验表明,本文的方法可以有效描述文本特征和文本主题特征在情感分析中的作用,能够取得较好

6、的分类效果。关键词:文本情感分析;主题特征;深度神经网络;多视角学习IAbstractTextisthemainmediumforpeopletoacquireknowledgeandinformation.WiththedevelopmentoftheInternetindustry,thenetworkhasaccumulatedalargenumberoftextdata,suchasnews,comments,articles,etc..Byminingandanalyzingthesubjectivecontentofviews,positions

7、andemotionsinthesetextdata,peoplecanquicklyextracttextinformationsoastoobtainexperienceandmakedecisions.Thefeaturesextractedfromthetext,thevolumeofwhichisincreasingrapidly,oftenhavethecharacteristicsofhighlatitude.Thetraditionalmachinelearningalgorithmisdifficulttodealwithsuchcompl

8、exdata,whichcanonlyuselang

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。