欢迎来到天天文库
浏览记录
ID:35180319
大小:5.29 MB
页数:49页
时间:2019-03-20
《基于统计的机器翻译研究及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、禱:心工程硕±学位论文基于统计的机器翻译研究及应用卢云飞■教师范会敏.教授:指导__方钉研究员申请学位级别王程硕壬工程领域2夺文去藥诊^2016年05月]1日密级^_分类号-^工程硕±学位论文基于统计的机器翻译硏究及应用卢云飞指导教师范会敏教授方红研究员申请学位级别王程硕王王程领域人工智能2015年05月n日基于统计的机器翻译研究及应用学科:软件王程研究生签字:i心寺:学校导师签字_
2、_《終_企业导师签字:摘要在互联网高速发展的信息时代,不同地区国家之间的交流变得更加容易和频繁,语言,不同语言之间的翻译的重要性与日俱增作为信息的载体。巨大的翻译需求推动着机器翻译的快速发展,在众多的翻译模型中,短语统计机器翻译模型应用最广且具有较高的翻译,近年来逐渐成为化器翻译领域的核也内容性能。本文研究的主要内容为基于短语的统计机器翻译系统的设计与实现,将机器翻译分为语料预处理,翻译模型训练,语言模型训练和解码器四个独立的功能模块。语料预处理主要包括分词W及格
3、式标准化;翻译模型训练主要包括词对齐,短语抽取W及短语评分:语、-G言模型使用最常用的Nram语言,模型;解码器是翻译系统的核屯模块包括翻译候选项,,搜索最优路径和译文生成王作获取计算未来翻译概率。本文采用基于找的搜索算法,在解码过程中,为了提高翻译效率,运用不同的剪枝策略分别对解码器进行优化,并通过实验对比不同剪枝策略对翻译结果的影响。一本文实现了个完整的统计机器翻译系统,能够完成基本的翻译需求,并对学者们提出的立方剪枝,柱状图剪枝,动态剪枝H种剪枝策略在该系统上实验,
4、通过实验数据得出各种剪枝策略的性能和适用范围。本文研究得出,基于找的解码算法具有较高的翻译性能,,但解码速度较慢其原因是翻译过程中有大量的翻译候选兀余,选择合适的剪枝方法,能够有效提高翻译效率。本文研究证实在立方剪枝,柱状图剪枝,动态剪枝H种剪枝策略中,立方剪枝的综合性能最高,并且相对安全和稳定:动态剪枝性能取决于剪枝对象的规模,其性能随着剪枝对象规模的增大而提高,在较大规模的翻译选项剪枝中有较好的表现。:统计机器翻译;立方;关键词;短语抽取;基于巧的解码算法剪枝柱状
5、图剪枝StatisticalMachineTranslationResearchandAlicationsppDiscipUne;SoftwareEngineeringStudentSignature:SupervisorSignature:an从瓜仰的下AbstractI打化6infbrmationagewi出rapiddevelopmentofInt:emet,communicationbetween*counlxiesin
6、difeientregionsbecomemoreeasilandfreuentl化elanguaeasacarrierofyqy,ginformationthetranslationbetweendiferentlanguagesbecomemoreimrtant.Great,polmentoftranslation打eedstoromotetheraiddeveomachi打etra打slation.Inma打transla
7、tionpppy^lsstatisticalinetlili:hidlhihmodemachiansato打modestemostweusedandhasa,ygerformanceinrece打tearsraduallbecamecoreCO打tentinthefieldofinetra打slationmach.p,ygyThemaincoiUentofl;hispaeristiledesinandimlem
8、entationofthehrasebasedpgppstatisticalmachinetranslationsystem,machinetranslationwillbedividedint:ofourindependentfiinctionalmodules化atdatapreprocessing,translationmodeltraining,languagemodelGainingdDa-andecoder.tarer
此文档下载收益归作者所有