欢迎来到天天文库
浏览记录
ID:33796823
大小:112.37 KB
页数:12页
时间:2019-03-01
《基于神经网络的英文机辅翻译预调序模型研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于神经网络的英文机辅翻译预调序模型研究韦祥刚赵足娥吴年利李培隆右江民族医学院外语系广西科技大学外国语学院右江民族医学院基础医学院摘要:长距离调序由于缺少有效的描述而成为英语统计机器翻译的一大挑战。针对长距离调序的可能途径:预调序,提岀了一种基于神经网络的英文机辅翻译预调序模型。该模型在线性排序框架下结合神经网络建模,可以从大量样本数据中抽取句法和语义等有用信息,以预测不同语言的语序差异。最后在屮文到英文的翻译机器和英文到中文的翻译机器上对该模型进行了实验。实验结果表明,该模型提高了系统性能,具有有效性。关键词:神经网络;统计机器翻译;预调序模型;长距离调序;作者简介:韦祥刚
2、(1966—),男,广西桂林人,副教授。研究方向为英语翻译教学与研究。作者简介:赵足娥(1975—)算机辅助英语翻译研究。女,湖南双峰人,副教授,硕士。研究方向为计作者简介:吴年利(1976—),机教学与研究。男,广西南宁人,讲师。研究方向为数学与计算副教授,硕士。研究方向为计作者简介:李培隆(1978-),男,广西柳州人,算机辅助英语翻译研究。收稿日期:2017-03-20基金:广西高校中青年教师基础能力提升项目(2017KY0505;KY2016YB240)ResearchonneuralnetworkbasedpreordermodelofEnglishmachine-
3、aidedtranslationWEIXianggangZHAOZueWUNianliLIPe订ongDepartmentofForeignLanguages,YoujiangMedicalCollegeofNationalities;SchoolofForeignLanguages,GuangxiUniversityofScienceandTechnology;CollegeofBasicMedicalSciences,YoujiangMedicalCollegeofNationalities;Abstract:Long-distancesequencinghasbecom
4、eamajorchallengeforEnglishstatisticalmachinetranslationduetothelackofeffectivedescription.ApreordermodelofEnglishmachine-aidedtranslationbasedonneuralnetworkisproposedinthispapertosolvethepossiblepathpreconditioningforsolvinglong-distanceorder.Themodelisbasedonneuralnetworkmodelingintheline
5、arsortingframework,andcanextractusefulinformationsuchassyntaxandsemanticsfromalargenumberofsampledatatopredictthedifferenceofwordorderindifferentlanguages.TheexperimentwascarriedoutonChinese-EnglishtranslationmachineandEnglish-Chinesetranslationmachine.Theexperimentalresultsshowthatthemodel
6、improvesthesystemperformanceandiseffective.Keyword:neuralnetwork;statisticalmachinetranslation;preordermodel;long-distancepreorder;Received:2017-03-200引言将短语作为基木翻译单元的统计机器翻译模型in可以对局部调序现象进行自动记录,而长距离调序由于缺少有效的描述成为统计机器翻译的一大挑战。文献[2-4]研究表明,解决长距离调序的可能途径是预调序。针对预调序,本文提出了一种基于神经网络的英文机辅翻译预调序模型。该模型是在线性排序框
7、架下结合神经网络建模,可以从大量样本数据中抽取句法和语义等有用信息,以预测不同语言的语序差异。1模型1.1词汇向量表示目前机器翻译的重难点为调序,本文在线性排序框架下结合神经网络学习词汇向量表示。Bengio等为改善传统语言处理系统的高维词汇推广能力弱的缺点固,提出基于神经网络的语言模型,将高维词汇转化为低维稠密向量并进行判别训练,相似词汇被映射到低维相似点。继而基于负抽样的快速学习法被提出回,其结构如图1所示。神经网络通过查找表LOOKUP搜索得到长度为2*1的词汇{wn,•••,Wo,•••,w」的
此文档下载收益归作者所有