基于深度学习的文本特征表示及分类应用

基于深度学习的文本特征表示及分类应用

ID:35067248

大小:5.13 MB

页数:67页

时间:2019-03-17

基于深度学习的文本特征表示及分类应用_第1页
基于深度学习的文本特征表示及分类应用_第2页
基于深度学习的文本特征表示及分类应用_第3页
基于深度学习的文本特征表示及分类应用_第4页
基于深度学习的文本特征表示及分类应用_第5页
资源描述:

《基于深度学习的文本特征表示及分类应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码10459学号或申请号201322172109密级专业硕士学位论文基于深度学习的文本特征表示及分类应用作者姓名:梁军导师姓名:柴玉梅教授专业学位名称:软件工程培养院系:信息工程学院完成时间:2016年5月AthesissubmittedtoZhengzhouUniversityforthedegreeofMasterTextFeatureRepresentationandClassificationbasedonDeepLearningByJunLiangSupervisor:Prof.YumeiCha

2、iSoftwareEngineeringSchoolofInformationEngineeringMay2016原创性声明:本人郑重声明所呈交的学位论文,是本人在导师的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的科研成果。对本文的研巧做出重要贡献的个人和集体,巧己在文中W明确方式标明。本声明的法律责任由本人承担。学位论文作者:曰期:〇年t月曰>/(譯聲学位论文使用授权声明本人在导师指导下完成的论文及相关的职务作品

3、,知识产权归属郑州大学。根据郑州大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部口或机构送交论文的复印件和电子版,允许论文被查阅和借网;本人授权郑州大学可将本学位论文的全部或部分编入有关数据库进行检索,可W采用影印、缩印或者其他复制手段保存论文和汇编本学位论文。本人离校后发表、使用学位论文或与该学位论文直接相关的学术论文或成果时一署名单位仍然为郑,第州大学。保密论文在解密后应遵守此规定。学位论文作者:曰期:年月曰jr球译摘要摘要随着互联网的发展,产生出大量非结构化

4、文本,这些文本中蕴含着丰富的信息,但由于其数据量庞大因此需要计算机自动地提取这些文本中的有效信息。本文试图利用深度学习方法去学习文本特征,并通过对模型的深化改进利用提取到的特征对文本进行深层处理,例如对文本数据进行情感分析,过滤风险广告词条等。通过在微博、影评进行情感分析以及在百度推广广告语料上进行风险广告过滤,结果证明本文提出的方法有效性。本文的主要工作有:本文在总结了深度学习常用的网络结构的基础之上,提出了基于RAE神经网络和极性转移的深度学习模型PRAE,该模型可以根据文本的结构信息和语法语义信息学习到文

5、本的表示,同时利用文本的标签进行训练可用于文本的情感分析任务。该模型不但可以学习到词语的词向量表示,而且可以根据句子的树形拓扑结构进行网络递归学习整个句子的向量表示。这样可以利用模型进行文本特征的自动学习,从而避免了进行人工特征工程构建,可以节省大量人力。通过实验验证利用该深度学习模型学习到的文本特征进行情感分类可以达到很好的效果。本文的另一项工作是结合LSTM(longshorttermmemory)记忆单元与递归神经网络(RecursiveNeuralNetworks,RSNN)提出LSTM-RSNN模型。

6、该模型充分结合递归神经网络和LSTM记忆单元的优点,利用递归神经网络学习句子的层次结构信息,而LSTM记忆单元的加入则可以使得学习句子特征表示时可以充分利用句子的历史信息。最后将LSTM-RSNN模型融合极性转移模型形成最终用于文本情感分析的PLSTM-RSNN模型。通过实验对比该模型与其他一些深度学习模型,该模型的性能优于其他模型。最后本文介绍了在实习期间利用paddle深度学习平台构建LSTM型RNN神经网络解决风险广告过滤问题,通过线上实践验证,深度学习模型针对不同类型风险广告具有很强的适应性,并且其效率

7、可以达到实际应用的水平。关键字:深度学习文本分析特征学习RNNLSTMIAbstractAbstractAsthedevelopmentoftheInternetandalargenumberofunstructuredtextwhichhumanityproducesoverall,sodoesneedtoautomaticallyextractthedifferenttypesofknowledgefromit.Thethesisattemptstousedeeplearningtolearntextfea

8、tures,inparticularitsstructureandmeaninginordertosolvemultiplehigherlevellanguagetasks,suchassentimentanalysis,filteringspam.ByanalyzingsentimentonmicroblogandreviewandfilteringriskonBaidu’sadve

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。