面向特定领域机器翻译的平行语料构建方法的研究

面向特定领域机器翻译的平行语料构建方法的研究

ID:35102219

大小:5.72 MB

页数:63页

时间:2019-03-17

面向特定领域机器翻译的平行语料构建方法的研究_第1页
面向特定领域机器翻译的平行语料构建方法的研究_第2页
面向特定领域机器翻译的平行语料构建方法的研究_第3页
面向特定领域机器翻译的平行语料构建方法的研究_第4页
面向特定领域机器翻译的平行语料构建方法的研究_第5页
资源描述:

《面向特定领域机器翻译的平行语料构建方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代巧:10004密级:公开^'典系交聲乂肇f福BEIJINGJIAOTONGUNIVERSITY硕±学位论文3ii^rr面向特定観机訓剧9平備料构建方法的硏究^作者姓名单华学科专业计龍科学与技术―.指导教师张玉洁教授;罗呼:苗培龍系计算机与信,旨技术訓.1艇,_.咖哪巧飼哥嚴簿^m!露I系义適乂攀硕±学位论文面向特定领域机器翻译的平行语料构建方法的研究ExlorinMethodoftheConstructionofParallelCorusforMachinepgp

2、TranslationinaSpecificDomain作者:单华导师:张玉洁北京交通大学2016年3月学位论文版权使用授权书本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可将学位论文的全部或部分内容编入有关数据库进行检索,提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编供查阅和借阅。同意学校向国家有关部口或机构送交论文的复印件和磁盘。学校可W为存在馆际合作关系的兄弟高校用户提供文献传递服务和交换服务。(保密的学位论文在解密后适用本授权说明)、学位论文作者签名:导师签名:

3、旅4巧6<签字日期:2引年3月三日签字日期:如[年3月日f^1学校代码:0004密级:公开北京交通大学硕±学位论文面向特定领域机器翻译的平行语料构建方法的研究ExlorinMethodoftheConstructionofParallelCorusforMachinepgpTranslationinaSecificDomainp作者姓名:单华学号:13120422:导师姓名:张玉洁职称教授学位类别:工学学位级别:硕±:学科专业计算机科学与技术研究方向:自然语言处理北京交通大学20

4、16年3月i致谢在张玉洁教授的悉必指导下,历时将近H个月,我终于完成了这篇论文的写,,作张玉洁教授还要指导很多学生,但是她还会。在做毕设期间任务非常繁重经常抽出时间关必我的写作进度,指导我完成科研工作,并在生活上给与我很大、的关屯和照顾,在此向张玉洁老师表示衷也的谢意。徐金安教授和陈娃枫老师对于我的科研工作提出了许多宝贵的意见,在此表I、的感谢示衷屯。在实验室工作及撰写论文期间,罗特、白露等同学对我论文的研究工作给予了热情帮助,在此向他们表达我的感激之情。另外也感谢我的家人和朋友,他们的理解和支持使我能够在学校专也完成我的学

5、业。北京交通大学硕±学位论文摘要摘要机器翻译是利用计算机实现不同自然语言间翻译的学科。统计机器翻译是当>前主流的机器翻译方法,它11^平行语料库为基础获取翻译知识,可切开发出高效、性能优良的翻译系统。但是当领域发生变化时,翻译系统由于缺少该领域的觀译知识导致性能降低。因此,构建大规模高质量特定领域的平行语料库对于该特定领域统计机器翻译系统性能的提高具有重要作用,但是平行语料库的人工构建成I本很高,利用机器翻译构建的质量又很低。针对这个问题,本文重点研究了人工翻译与机器翻译相结合的平行语料构建方法,yi?实现低成本高效率地构建平

6、行语料的目标。本文根据持定语言对间翻译人员的现实情况提出了两种平行语料构建方法:(1)在目标语言对的翻译人员奇缺的情况下,本文提出了基于枢轴语言的平行语料构建方法,并融合,即利用第H种语言作为桥梁,借助己有的机器翻译技术主动学习方法,构建目标语言对的大规模高质量平行语料库。本文通过W英语作为枢轴语言构建日汉平行语料库的实例研究,利用成熟的基于短语的统计机器翻译技术,重点描述了基于枢轴语言的平行语料构建方法、基于主动学习的领域适应方法、基于译文自动评测的良好译文选择方法、翻译系统的更新迭代和评价实验。实验结果表明,该方法能够快速构建日汉平行语

7、料,并有效提高日汉翻译系统的性能。口目标语言对的翻译人员充足的情况下,为了提高使用机器翻译构造的平)在行语料质量,本文提出了基于依存柯到串翻译模型的平行语料构建方法。该方法直接利用目标语言对的翻译系统构建平行语料,提出利用依存树所包含的句法知识和语义知识来构建翻译模型一。同时与方法样使用基于主动学习的领域适应方法,通过提高翻译系统性能达到提高平行语料质量的目的。本文通过构建日汉平行语料库的实例研巧,重点描述了基于依存树到串的翻译模型,并将该模型用于日汉统计机器翻译并进行了评测,。评测结果显示

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。