欢迎来到天天文库
浏览记录
ID:9154302
大小:107.18 KB
页数:14页
时间:2018-04-19
《译后编辑自动化的英汉机器翻译新探索》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、译后编辑自动化的英汉机器翻译新探索李梅朱锡明同济大学摘要:木研宄为一项历时五年旨在实现机器翻译译后编辑自动化的新探索。在汽车专业十万句对英汉翻译平行语料库基础上对英汉机器翻译的译文分析表明,由于机译系统按照设定的规则处理自然语言翻译,所生成译文的错误屮隐含内在规律。针对那些具规律性且出现频率高的机译典型性错误,作者设想对它们进行机器翻译的二次加工,即做译后编辑的自动化处理以过滤这些典型性错误,从而加快机译速度并提高机译质量。木文介绍了该研宄的设计思路,研宄对象和内容及机器翻译语料分析的方法等,在展示阶段性成果的同吋希望能引起机器翻译行业专家们的关注以共同进行后期产品研发。关键词:英汉机器翻译;
2、译后编辑;语料分析;典型性错误;汽车专业翻译语料;作者简介:李梅,同济大学外国语学院英语系教授,研究方向:句法学、翻译教学与实践;may@tongji.edu.cn;作者简介:朱锡明,同济大学外国语学院公共英语教学部讲师,研宂方向:应用语言学及语料库语言学。tongjisimon@tongji.edu.cn基金:教育部人文社会科学研究项目“机器翻译译后编辑模式研究”(07JA740010)资助研宄成果引言在信息化时代的今天,高效使用现代化手段来超越人们交往时的语言障碍己成了人们的迫切愿望。利用计算机进行不同语言之间自动翻译的机器翻译随着网络自动翻译的广泛应用已逐渐被大众接受并成为克服自然语言障
3、碍的一个重要手段。然而,机器翻译在提高速度的同时,其翻译质量却一直饱受诟病。提高机器翻译译文质量主要有两种途径,一是进一步完善机器翻译软件来提高所生成的正文质量,二是对机器译文进行译后编辑处理。完善翻译软件是机器翻译问世以来人们一直致力的方向(详见本文第二节),牵涉到修改软件内部的语言规则,可谓牵一发而动全身,工程庞大而复杂。常常是一项规则修改后解决了现存问题,却引起了新的其至更多的问题。于是,近年来人们将0光转向了对机器翻译系统生成的译文进行译后编辑。由于机器翻译质量的不可靠性,译后编辑已成为机器翻译中为提高翻译质量而存在的一个必不可少的环节,它直接决定了翻译的质量、速度和成本。在这样的背景
4、下,本研究在依托同济大学汽车资料研发中心所建立的10万句对(含短语)汽车专业英汉翻译语料库基础上,花费Y五年多时间探索译后编辑自动化的机器翻译新思路。接下来我们将介绍本研宄的设计思路、研宄对象与内容、语料分析方法及数据统计结果等内容。由于篇幅关系,有关本研究的详细统计数据、典型性错误句法分析等内容将另文阐述。二、设计思路综观半个多世纪的机器翻译研究不难发现这些研究关注的是将源语言转化成R标语言的纯正文翻译系统的研制和开发,包括从语言规则制定、理论应用、技术处理到研宄方法等等(冯志伟,2005:35-64;刘涌泉,1997:79-82;俞士汶,2003;Hutchins,2005:7-22;张克
5、亮,2007:1-22;张政,2010:1-59)。由于机器翻译系统的极度复杂性使得提高译文质量越来越艰难,其至出现了所谓的“雪线”现象(张克亮,2007:vi),于是,人们开始将目光投向纯正文机器翻译之后的环节,即计算机辅助译后编辑环节。此环节不再聚焦机器翻译的系统本身,而关注系统产生译文后,如何建立一个独立的子系统进行译后编辑,从而提高最终译文的质量(黄河燕、陈肇雄,1995;Allen,2003:97-317;Krings,2001;Schafer,2003:1_11;陈欣蓉,2007:97-109)。近年来,对译后编辑的探讨主要体现在对机器翻译质量效率的评测(俞士汶,2003)和对不同
6、机译系统的译文比较研宄(Allen,2003:97-317;史宗玲,2006)等方面。同时,对译后编辑的软件开发已取得可喜的成绩。智能译后编辑器的开发和应用大大方便了译文错误的删除、插入和修改等处理手段,提高了译后编辑的速度(黄河燕、陈肇雄,1995)。遗憾的是,译后编辑器虽然智能,但其更多的是为错误修改提供多选从而方便人工操作,最终仍需通过人工来完成,其速度与计算机相比仍大打折扣。对机器译文的分析研宄表明由于机器翻译系统按照设定的规则处理自然语言,其生成的译文不乏“愚蠢”的低级错误,而这些低级错误中却隐含着科学道理:相当数量的错误呈内在固定格式,具有较强的相似度及规律性,同时,它们具有较高的
7、重复率。而对此类规律性强、出现频率高的错误修改仍采用人工修改的方式进行,不仅降低了机器翻译的速度,提高了机器翻译的成本,同时也是对人工翻译资源的浪费。因此,陈欣蓉建议系统化地研究机器译文的错误,以提升机器译文修改研宄之效能(陈欣蓉,2007:97-109)。木研宄在此基础上进一步提出了译后编辑自动化的研究设想(李梅,2008),其总体设计思路为:在机器翻译系统对自然语言进行翻译处理生成机器译文后,
此文档下载收益归作者所有