基于层次短语模型的蒙-汉统计机器翻译研究

基于层次短语模型的蒙-汉统计机器翻译研究

ID:33528636

大小:2.08 MB

页数:55页

时间:2019-02-26

基于层次短语模型的蒙-汉统计机器翻译研究_第1页
基于层次短语模型的蒙-汉统计机器翻译研究_第2页
基于层次短语模型的蒙-汉统计机器翻译研究_第3页
基于层次短语模型的蒙-汉统计机器翻译研究_第4页
基于层次短语模型的蒙-汉统计机器翻译研究_第5页
资源描述:

《基于层次短语模型的蒙-汉统计机器翻译研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码:分类号:10126TP391.2论文题目学号:编号:31109013研究生:菱佳捷指导教师:堡塞坦塾拯专业:让篡扭型堂皇撞丕研究方向:蟹能值皇处堡所在学院:让篡扭堂瞳2014年4月30日原创性声明本人声明:所呈交的学位论文是本人在导师的指导下进行的研究工作及取得的研究成果。除本文已经注明引用的内容外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得内蒙古大学及其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意。学位论文作者签名:在学期间研究成果使用承诺书本

2、学位论文作者完全了解学校有关保留、使用学位论文的规定,即:内蒙古大学有权将学位论文的全部内容或部分保留并向国家有关机构、部门送交学位论文的复印件和磁盘,允许编入有关数据库进行检索,也可以采用影印、缩印或其他复制手段保存、汇编学位论文。为保护学院和导师的知识产权,作者在学期间取得的研究成果属于内蒙古大学。作者今后使用涉及在学期间主要研究内容或研究成果,须征得内蒙古大学就读期间导师的同意;若用于发表论文,版权单位必须署名为内蒙古大学方可投稿或公开发表。学位论文作者虢塑是日期:丝丝』=£指导教师签名:日期:内蒙古大学硕士学位论文基于层次短语模型的蒙

3、一汉统计机器翻译研究摘要随着我国经济、贸易、文化、教育等各个方面飞速发展,跨地区、跨民族的交流与合作越来越密切。不同民族之间的交流对翻译存在巨大的需求。近些年来,我国内蒙古自治区的经济发展十分迅猛,越来越多的企业与个人来到内蒙古地区进行贸易活动。这使得人们对传统蒙古文到汉文之间的翻译的需求越来越大。然而,人工翻译满足不了快速膨胀的需求,因此必须借助统计机器翻译技术。目前主流的统计机器翻译方法包括:基于短语的机器翻译、基于层次短语的机器翻译、基于句法树的机器翻译等。目前,传统蒙古文.汉文的机器翻译发展得还不是很成熟。因此,本文针对传统蒙古文.汉

4、文翻译中的特点,对基于统计的蒙.汉机器翻译方法进行了研究。首先,为了解决蒙.汉语言结构差异大、在翻译中普遍存在长距离调序等问题,本文对基于层次短语的统计机器翻译模型进行了深入的研究。之后,本文实现了一套基于层次短语的蒙一汉统计机器翻译系统。该系统可以从未经人工标注的平行语料中自动学习加权的同步上下文无关文法(WSCFG),并利用该同步文法以及基于改进的CKY的解码算法进行高效的蒙.汉翻译。除此之外,针对蒙一汉统计机器翻译平行语料中拼写错误较多的问题,本文提出了一种基于统计翻译框架的传统蒙古文自动拼写校对方法。该方法将拼写校对的过程看作是一种翻

5、译的过程,并引入统计翻译模型进行拼写校对。该方法的校准率最高可以达到97%以上。在最终的翻译对比实验中,本文使用这种方法对基于短语和基于层次短语的蒙一汉机器翻译的训练语料进行的拼写校对。该方法有效缓解了数据的稀疏问题,从而对翻译模型的训练提供了很大的帮助。最终的对比实验表明,比起传统的基于短语的翻译模型,基于层次短语的统计机器翻译模型更加适合从传统蒙古文到汉文的翻译任务,测试集在BLEU值上得到1个百分点的提高。同时,在这两种翻译系统上嵌入的本文提出的拼写校对系统,翻译结果均有不同程度的提升。关键词:蒙古文,汉文,拼写校对,统计机器翻译,层次

6、短语基于层次短语的蒙.汉统计机器翻译研究HIERARCHICALPHRASE.BASEDMoNGOLIAN.CHⅢESESTATISTICALmCHINETRANSLATIoNABSTRACTWiththerapiddevelopmentinfieldssuchaseconomy,trade,cultureandeducation,thecommunicationsbetweendifferentpeoplesandregionsisfastlyincreased。Recentyears,manypeoplecametoInnerMongol

7、iafortradeortravel。ThedemandoftranslationfromMongoliantoChineseisboosted.However,mannultranslationCannotmeetthesedemands,SOthemachinetranslationbecamenecessary.Inpresent,stateoftheartmachinetranslationmethodsincludesphrase—basedmodel,hierarchicalphrase—basedmodel,andsyntaxt

8、ree—basedmodel.Thispaperaimstodoresearchonhierarchicalphrase-basedmachinetranslaio

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。