欢迎来到天天文库
浏览记录
ID:5322058
大小:160.46 KB
页数:8页
时间:2017-12-08
《多策略的机器翻译》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、多策略的机器翻译王海峰东芝(中国)研究开发中心北京100738wanghaifeng@rdc.toshiba.com.cn摘要:统计机器翻译方法由于其良好的数学模型、无指导的学习能力、良好的鲁棒性等优点而备受重视。基于规则的机器翻译方法对语言规律良好的概括和描述能力以及基于实例的机器翻译方法对相似句子相当精确的翻译也颇有价值。多种方法相融合的机器翻译策略正在成为机器翻译发展的重要方向。本文全面介绍东芝对规则、实例、统计等各种机器翻译方法的研究,以及在融合各种方法方面的探索。关键词:机器翻译,基于规则的机器翻译
2、,基于实例的机器翻译,统计机器翻译,多策略机器翻译Multi-StrategyMachineTranslationWangHaifengToshiba(China)Research&DevelopmentCenterBeijing100738wanghaifeng@rdc.toshiba.com.cnAbstract:StatisticalMachineTranslation(SMT)isverypopularforitsadequatemathematicalmodel,unsupervisedlearni
3、ngcapacity,androbustness.Rule-BasedMachineTranslation(RBMT)andExample-BasedMachineTranslation(EBMT)methodsarealsovaluable.Rulesaregoodatmodelinglinguistictheoryandphenomena.EBMTmethodisabletotranslatesimilarinputverywell.Multi-strategymachinetranslationbeco
4、mesmoreandmoreimportantinthemachinetranslationcommunity.ThispaperintroducesToshiba'seffortsonRBMT,EBMT,SMTandthecombinationofthethreemethods.Keywords:MachineTranslation,Rule-basedMachineTranslation,Example-basedMachineTranslation,StatisticalMachineTranslati
5、on,Multi-StrategyMachineTranslation1引言在三种主流机器翻译方法中,统计机器翻译方法正受到学术界更多的关注。一方面,在1具有广泛影响力的NIST机器翻译评测中,统计机器翻译系统连连胜出;另一方面,在ACL等主流学术会议上,也是多数机器翻译方面的论文都集中在统计方法上。那么,是不是基于规则的机器翻译方法和基于实例的机器翻译方法就已经江河日下,行将退出历史舞台了呢?让我们首先关注一下规则方法和实例方法的现状。规则方法虽然已经较少出现在主流学术会议上了,但一个有趣的现象是,目前真正
6、为用户所使用的机器翻译产品大多都是基于规则的。同时,规则方法也并不是停滞不前了,而是仍有不断提高的潜力[1]。目前来看,实例方法不如规则方法在产品中应用广泛,也不如统计方法在学术会议上广受重视及在评测中胜出,但实例方法也依然活跃并富有潜力。在2005年的机器翻译峰会(MTSummitX)上,实例方法仍然是与会学者大量讨论的话题,而且MTSummitX还专门组织1http://www.nist.gov/speech/tests/mt/了一个基于实例机器翻译的Workshop,著名的机器翻译专业国际期刊“Mach
7、ineTranslation”也将在2006年下半年发行基于实例机器翻译的专刊。从译文质量的角度,实例方法也毫不逊色甚至还能做得更好[2,3,4]。虽然统计方法由于其良好的数学模型、无指导的学习能力、良好的鲁棒性等优点而备受重视,但规则方法对语言规律良好的概括和描述能力及实例方法对相似句子相当精确的翻译也无疑是颇有价值的。事实上,多种方法相融合的机器翻译策略正在成为机器翻译发展的重要方向。例如,基于语法的模型越来越多的出现在统计机器翻译的研究中[5,6,7,8];Groves和Way提出了Statistica
8、lEBMT[9]和Example-basedSMT[3]的概念,等等。而更多的机器翻译系统则是在一种翻译策略为主体的前提下,在系统的不同模块分别使用了不同的技术,例如[4]就在基于实例的机器翻译框架下使用了基于规则的分析和基于统计的生成。本文将全面介绍东芝在机器翻译领域的研究,包括基于规则的、基于实例的、统计的机器翻译方法,以及各种方法的融合。2东芝的机器翻译研究2.1概述从最初开展基于规则的机器翻
此文档下载收益归作者所有