基于统计的机器翻译研究及应用

基于统计的机器翻译研究及应用

ID:35180319

大小:5.29 MB

页数:49页

时间:2019-03-20

基于统计的机器翻译研究及应用_第1页
基于统计的机器翻译研究及应用_第2页
基于统计的机器翻译研究及应用_第3页
基于统计的机器翻译研究及应用_第4页
基于统计的机器翻译研究及应用_第5页
资源描述:

《基于统计的机器翻译研究及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、禱:心工程硕±学位论文基于统计的机器翻译研究及应用卢云飞■教师范会敏.教授:指导__方钉研究员申请学位级别王程硕壬工程领域2夺文去藥诊^2016年05月]1日密级^_分类号-^工程硕±学位论文基于统计的机器翻译硏究及应用卢云飞指导教师范会敏教授方红研究员申请学位级别王程硕王王程领域人工智能2015年05月n日基于统计的机器翻译研究及应用学科:软件王程研究生签字:i心寺:学校导师签字_

2、_《終_企业导师签字:摘要在互联网高速发展的信息时代,不同地区国家之间的交流变得更加容易和频繁,语言,不同语言之间的翻译的重要性与日俱增作为信息的载体。巨大的翻译需求推动着机器翻译的快速发展,在众多的翻译模型中,短语统计机器翻译模型应用最广且具有较高的翻译,近年来逐渐成为化器翻译领域的核也内容性能。本文研究的主要内容为基于短语的统计机器翻译系统的设计与实现,将机器翻译分为语料预处理,翻译模型训练,语言模型训练和解码器四个独立的功能模块。语料预处理主要包括分词W及格

3、式标准化;翻译模型训练主要包括词对齐,短语抽取W及短语评分:语、-G言模型使用最常用的Nram语言,模型;解码器是翻译系统的核屯模块包括翻译候选项,,搜索最优路径和译文生成王作获取计算未来翻译概率。本文采用基于找的搜索算法,在解码过程中,为了提高翻译效率,运用不同的剪枝策略分别对解码器进行优化,并通过实验对比不同剪枝策略对翻译结果的影响。一本文实现了个完整的统计机器翻译系统,能够完成基本的翻译需求,并对学者们提出的立方剪枝,柱状图剪枝,动态剪枝H种剪枝策略在该系统上实验,

4、通过实验数据得出各种剪枝策略的性能和适用范围。本文研究得出,基于找的解码算法具有较高的翻译性能,,但解码速度较慢其原因是翻译过程中有大量的翻译候选兀余,选择合适的剪枝方法,能够有效提高翻译效率。本文研究证实在立方剪枝,柱状图剪枝,动态剪枝H种剪枝策略中,立方剪枝的综合性能最高,并且相对安全和稳定:动态剪枝性能取决于剪枝对象的规模,其性能随着剪枝对象规模的增大而提高,在较大规模的翻译选项剪枝中有较好的表现。:统计机器翻译;立方;关键词;短语抽取;基于巧的解码算法剪枝柱状

5、图剪枝StatisticalMachineTranslationResearchandAlicationsppDiscipUne;SoftwareEngineeringStudentSignature:SupervisorSignature:an从瓜仰的下AbstractI打化6infbrmationagewi出rapiddevelopmentofInt:emet,communicationbetween*counlxiesin

6、difeientregionsbecomemoreeasilandfreuentl化elanguaeasacarrierofyqy,ginformationthetranslationbetweendiferentlanguagesbecomemoreimrtant.Great,polmentoftranslation打eedstoromotetheraiddeveomachi打etra打slation.Inma打transla

7、tionpppy^lsstatisticalinetlili:hidlhihmodemachiansato打modestemostweusedandhasa,ygerformanceinrece打tearsraduallbecamecoreCO打tentinthefieldofinetra打slationmach.p,ygyThemaincoiUentofl;hispaeristiledesinandimlem

8、entationofthehrasebasedpgppstatisticalmachinetranslationsystem,machinetranslationwillbedividedint:ofourindependentfiinctionalmodules化atdatapreprocessing,translationmodeltraining,languagemodelGainingdDa-andecoder.tarer

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。