欢迎来到天天文库
浏览记录
ID:17827365
大小:5.80 MB
页数:66页
时间:2018-09-06
《基于深度神经网络的中英机器翻译模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、论文题目:基于深度神经网络的中英机器翻译模型研究学位类别:工程硕士学科专业:计算机技米年级:2051研究生:邵博指导教师:戴齐二零一八年六月国内图书分类号:TP391.2密级:公开国际图书分类号:004西南交通大学研究生学位论文基于深度神经网络的中英机器翻译模型研究年级2015姓名邵博申请学位级别硕士专业计算机技术指导老师戴齐二零一八年六月ClassifiedIndex:TP391_2U
2、:004.D.CSouthwestJiaotonUniversitgyMasterDereeThesisgRESEARCHONCHINESEANDENGLISHMACHINETRANSLATIONMODELBASEDONDEEPNERUALNETWORKGrade:2015Candidate:ShaoBoAcademicDereeAliedfor:MastergppSecialit:ComuterTechnolopypgySu
3、pervisor:DaiiQJun2018,西南交通大学学位论文版权使用授权书、本学位论文作者完全了解学校有关保留使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权西南交通大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复印手段保存和汇编本学位论文。本学位论文属于1.保密□,在年解密后适用本授权书;2.不保密《a,使用本授权书。“”(请在以上方框内打V)学位论文作者
4、签名:指导老师签名:曰期:W日期:西南交通大学硕士学位论文主要工作(贡献)声明本人在学位论文中所做的主要工作或贡献如下:1.对神经机器翻译方法进行研究,根据不同神经网络结构分别构建基于_、基于LSTM以及基于GRU的神经机器翻译模型,将注意力机制加入模型中解决长距离依赖问题。提出基于双向GRU的神经机器翻译模型以提髙源语言端的上下文表示能力,进行实验验证了改进方法的有效性。2,.将词性序列信息以编码的形式加入神经机器翻译模型编码器部分增加背景向量语义表示信息一,进步提升翻译
5、性能。本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研宄工作所得的成果。除文中己经注明引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的研宄成果。对本文的研究做出贡献的个人和集体,均己在文中作了明确说明。本一人完全了解违反上述声明所引起的切法律责任将由本人承担。学位论文作者签名:曰期:西南交通大学硕士研究生学位论文第丨页摘要在经济全球化的背景下,随着互联网技术的迅速发展,各个行业的国际交流日益一频繁,跨语言交流的需求愈发明显。机器翻译作为种髙效工
6、具,能够在保留原始语义的前提下实现不同语言间的等价转换,具有很大的实用意义。近年来深度学习技术迅速发展,不仅仅在语音识别、图像处理领域,自然语言处理领域的相关研宄也取得了不错成果,本文针对基于深度神经网络的中英机器翻译模型进行研宄。-本文采用端到端的编码器解码器框架构建神经机器翻译模型,让机器自动地进行特征学习,将语料数据采用分布式表示的方式转化为词向量,使用神经网络实现源语言和目标语言之间的直接映射。针对不同神经网络结构构建神经机器翻译模型进行研宄。首先利用三种神经网络结构构建神
7、经机器翻译模型,RNN网络结构能够处理不定长序列的特点构建神经机器翻译模型,但存在梯度爆炸和梯度消失的情况。基于LSTM网络的翻译模型,通过门阀机制缓解了梯度衰减,提升了处理长距离序列的能力,基于GRU网路结构在其基础上进行了简化处理,降低训练复杂度的同时也取得了不错的性能。针对编码器部分任意长度源语言序列均被编码成固定维度背景向量的问题,引入注意力机制动态调整源语言端上下文对目标语言序列的影响程度,提升翻译模型处理长距离依赖的能力一RU的。为更好地体现上下文信息,本文进步提出基于双向
8、G机器翻译模型,针对多种翻译模型进行对比分析,验证模型性能提升的有效性。针对神经机器翻译不能很好地利用语言学知识的问题,提出加入词性序列信息的神经机器翻译模型,在融合注意力机制的双向GRU的翻译模型的基础上,采用StanfordParser进行句法分析获取词性序列信息后,以双向编码的形式将其融入翻译模型的编码器部分,采用向量拼接的方式共同构成背景向量。实验表明,词性序列信息的加入
此文档下载收益归作者所有