一种基于联合深度神经网络的食品安全信息情感分类模型

一种基于联合深度神经网络的食品安全信息情感分类模型

ID:9152385

大小:77.00 KB

页数:9页

时间:2018-04-19

一种基于联合深度神经网络的食品安全信息情感分类模型_第1页
一种基于联合深度神经网络的食品安全信息情感分类模型_第2页
一种基于联合深度神经网络的食品安全信息情感分类模型_第3页
一种基于联合深度神经网络的食品安全信息情感分类模型_第4页
一种基于联合深度神经网络的食品安全信息情感分类模型_第5页
资源描述:

《一种基于联合深度神经网络的食品安全信息情感分类模型》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、一种基于联合深度神经网络的食品安全信息情感分类模型刘金硕张智武汉大学计算机学院针对因屮文食品安全文本特征表达困难,而造成语义信息缺失进而导致分类器准确率低下的问题,提出一种基于深度神经网络的跨文本粒度情感分类模型。以食品安全新闻报道为目标语料,采用无监督的浅层神经网络初始化文本的词语级词向量。引入递归神经网络,将预训练好的词向量作为下层递归神经网络(RecursiveNeuralNetwork)的输入层,计算得到具备词语间语义关联性的句子特征向量及句子级的情感倾向输出,同时动态反馈调节词向量特征,使其更加接近食品安全特定

2、领域内真实的语义表达。然后,将递归神经网络输出的句子向量以时序逻辑作为上层循环神经网络(RecurrentNeuralNetwork)的输入,进一步捕获句子结构的上下文语义关联信息,实现篇章级的情感倾向性分析任务。实验结果表明,联合深度模型在食品安全新闻报道的情感分类任务中具有良好的效果,其分类准确率和F1值分别达到丫86.7%和85.9%,较基于词袋思想的SVM模型有显著的提升。关键词:联合神经网络模型;多粒度文本特征;词向量;食品安全;情感倾向性分析;文本情感分类技术日臻成熟,特征表示成为研究的技术瓶颈,人工或者无监

3、督的特征选择的好坏决定了分类模型的优劣。根据词频信息、情感约束规则和否定词前缀等特征影响因子进行选择优化,并在此基础上构建情感词典及进行句法结构分析,使有标记的数据的作用最大化,有效地提高Y传统线性分类模型的准确率m。己有研宄中基于词袋思想的人工特征选择难以在分类过程中发掘潜在的情感倾向和关性语义特征,如瘦肉精、三聚铽胺、地沟油等食品安全领域常用的负向词语,在特征表示的时候需要大量人工标记的数据做支持,并丑在该特定领域内根据已标注的文本进行未标注文本学习的难度极大。本文提出一种联合深度祌经网络模型,该模型以浅层网络预训练

4、的词向量为输入,捕获词语和句子两级文本粒度之间的相互关联性及隐合语义特征,实现篇章级的文本情感倾向判别。首次提出采用联合神经网络的方法处理食品安全新闻信息的情感分类问题,并获得了正负二元标注的食品安全信息语料库。通过实验发现,两级全连接的神经网络在分类过程中逐层反馈调节各节点单元向量,使单元向量更加接近其真实语义环境丁的表达,明显提高了分类的准确率。本文第2节介绍传统情感分类方法和基于深度学习的情感倾向性分析的相关工作;第3节介绍本文提出的基于联合深度神经网络的食品安全信息分类方法;第4节为实验及实验结果分析;最后总结全

5、文。2相关工作2.1传统情感分类2002年,康奈尔大学的BoPang等人位1首次提出了文本情感分类的概念,并采用贝叶斯(NaiveBayes)、最大摘和支持向量机(SVM)等模型M进行文本情感倾向预测实验,为自然语言文木倾向性分析的研宄拉开了序幕。半监督的情感分类技术以其兼顾人工标注的成本和模型自主学效果的优势,成为近年来传统分类器进行模型优化的研究热点。Yang和Cardie等m将情感分类任务分解为弱监督的情感片段识别和有监督的属性标注两个子过程,分别建立概率模型并进行联合训练,通过获取不同粒度的文本情感表达式之间的相

6、互影响关系和情感关联性,完成句子的情感标签得分计算。线性分类模型在语义捕获方面的劣势使其在没有巨大人工投入的前提下,在分类效果上始终存在难以突破的瓶颈。屮文微博数据的情感分类研宄一直是该领域内的研宄热点。张志琳等M提出丫基丁•词汇化主题特征、情感词内容特征和概率化的情感词倾向性等多样化特征的中文微博情感分类方法,显著改善了微博情感分析的性能。梁军等m探讨了基于深度学习的方法来进行中文微傅的情感倾向性分析的可能性,釆用深度祌经网络来发现任务相关的特征,避免依赖于手工特征设计,节省了大量人工标注的工作量。微博短文本的情感分类

7、研宄给篇章级长文本分类任务带来Y启发,篇章级文本具备更加丰富的语义信息,短文本的待征选择方法在面对多级粒度结构的长文木时,难以捕获全局的语义信息,使分类效果达不到预期的效果。2.2基于深度学习的情感倾向性分析深度学习的动机在于模拟人脑进行分析学习,将信息通过简单非线性的多层神经网络叠加的模型转变成更高层次、更加抽象的表达,它在图像处理和语音识别方向的成功应用给自然语言情感倾向性分析的研究带来了新的启发。Maas等M提出丫一种棊于词向量的情感分类方法,该方法采用无监督的模型计算词语之间的语义相似度,同时以有监督的方法获取文

8、本中存在的语义信息,模型在标注的公共语料库的分类实验中取得了非常不错的效果。词语的极性计算在一定程度上影响着分类效果,但分类模型在分类任务中起着更为关键的作用。Socher等m基于递归的自动编码器给出了一个新型的机器学框架,该框架学>」词语和短语块等不同粒度情感表达式的向量表示,并将学习结果作为情感分类器的特征输入,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。