机器翻译常见错误类型总结_x

机器翻译常见错误类型总结_x

ID:17498774

大小:183.06 KB

页数:15页

时间:2018-09-02

机器翻译常见错误类型总结_x_第1页
机器翻译常见错误类型总结_x_第2页
机器翻译常见错误类型总结_x_第3页
机器翻译常见错误类型总结_x_第4页
机器翻译常见错误类型总结_x_第5页
资源描述:

《机器翻译常见错误类型总结_x》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、机器翻译常见错误类型总结基金项目:国家自然科学基金(61379086)---CWMT2013机器翻译人工评测结果再分析赵红梅刘群中国科学院智能信息处理重点实验室中科院计算所北京100190E-mail:{zhaohongmei,liuqun}@ict.ac.cn摘要:本文在CWMT2013人工评测的基础上,对人工评测中有关错误类型的评测结果进行了总体分析,重点、细致地分析和统计了英汉机器翻译最常见的几种错误类型以及产生这些错误的原因等,同时深入分析和比较了基于规则的系统和基于统计的系统在这几种错误类型上的表现差异,旨在更全面、深刻地揭示机器翻译目前存在的主要问题,进而为机

2、器翻译系统质量的提升提供较为全面、客观、细致的数据参考。关键字:机器翻译、常见错误类型、译文选词错误、实词译文缺失、词序不对、译文和原文意思相反CommonErrorAnalysisofMachineTranslationOutputHongmeiZhaoandQunLiuKeyLabofIntelligentInformationProcessingofChineseAcademyofSciences(CAS),InstituteofComputingTechnology,CAS,Beijing100190,ChinaE-mail:{zhaohongmei,liuqun

3、}@ict.ac.cnAbstract:Basedonthemanualevaluationforthe9thChinaWorkshoponMachineTranslation,thispapergivesafurtherdetailedanalysisandstatisticsonseveralcommonerrortypesappearinginthegeneratedtranslations,anddisclosesthemainsourcesoftheseerrors.Meanwhile,thispaperalsopresentstheperformancedif

4、ferencesoneachcommonerrortypebetweenrule-basedMTsystemandstatisticalMTsystem.Keywords:Machinetranslation,commonerrortype,incorrectwords,missingcontentwords,wrongwordorder,translationwiththemeaningcontrarytotheoriginal.1引言第九届全国机器翻译研讨会(CWMT2013)机器翻译评测在英汉和维汉新闻机器翻译项目上设置了人工评测。人工评测采用由参评单位参与的“众包

5、”的方式。每个评测结果分别由三位评测者从忠实度和流利度两个方面进行打分。同时还要求评测者对所打分的句子进行错误分析,即对以下选项进行单选或多选:1)译文选词错误;2)实词译文缺失;3)词序不对;4)译文和原文意思相反;5)命名实体问题;6)数量词/时间词问题;7)其它错误;8)没有错误。最终评测结果表明:在两个项目上,前三种错误类型最为常见。关于CWMT2013人工评测的具体内容请参考《CWMT2013机器翻译评测报告》[赵红梅等,2013]。本文作者在以上人工评测的基础上,分别对基于统计和基于规则的英汉机器翻译系统的译文进行分析。重点抽样考察了被判断有上述前四种错误的机

6、器翻译译文。针对这些译文的错误展开了进一步的分类和统计,揭示了这些错误发生的原因,以期能更全面、细致地了解机器翻译的现存问题,从而为业界同行改善机器翻译系统质量提供有意义的数据参考。2错误类型的确立及定义作者在确立错误类型方案之前,特意对不同翻译方法/模型的英汉机器翻译译文进行了实际的错误分析和统15计,并参考以往研究工作的知识和经验、英汉和维汉机器翻译的具体特点以及研究者们比较关心的错误类型等,制定了英汉和维汉人工评测错误类型分类方案。方案出来后经过几位专家的认真讨论而最终得以确立。对于七种错误类型以及“没有错误”的判断,我们分别定义如下:1)译文选词错误:指原文单词有

7、对应译文,但译文错误或者不准确;2)实词译文缺失:指缺少应有的实词译文,主要包括以下几种情形:1’译文消失:指实词原文缺少必须翻译出来的相应译文;2’原文照搬:实词译文为不符合翻译要求的原文照搬;3’省略未译:没有根据翻译需要翻译出原文中省略的实词。3)词序不对:指原文中有的单词或单词串的意思虽然翻译出来了,但在译文中出现的位置不正确,导致译文不流畅或令人费解;4)译文与原文意思相反:指译文有的单词或单词串的含义与原文完全相反,这是在信息传递中最不能让受众接受的错误之一;5)命名实体问题:指原文中的命名实体(包括人名、地名、机

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。