语料对齐技术的翻译应用研究

语料对齐技术的翻译应用研究

ID:32963400

大小:63.08 KB

页数:7页

时间:2019-02-18

语料对齐技术的翻译应用研究_第1页
语料对齐技术的翻译应用研究_第2页
语料对齐技术的翻译应用研究_第3页
语料对齐技术的翻译应用研究_第4页
语料对齐技术的翻译应用研究_第5页
资源描述:

《语料对齐技术的翻译应用研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、语料对齐技术的翻译应用研究王华树王少爽广东外语外贸大学外语研究与语言服务协同创新中心摘要:对齐是双语或多语语料加工的关键技术,亦是功能化翻译资源建设的重要手段。本文探讨了语料对齐技术的基本原理,阐述了语料对齐工具的分类,剖析了对齐技术在翻译相关领域中的多维应用。文章认为,利用对齐技术建设大规模双语或多语翻译资源,可为国家翻译能力构建与发展提供基础设施保障。关键词:对齐技术;翻译资源;国家翻译能力;慕础设施;作者简介:王华树:wanghuashu@vip.qq.com作者简介:王少爽,wssnku@163.com收稿日期:2017-07-31基金:国家社科基金重

2、大项目“双语术语知识库建设与应用研究”(15ZDB102)的阶段性成果OntheApplicationofCorpusAlignmentTechnologyinTranslationWANGHuashuWANGShaoshuan£Abstract:Alignmenttechnologyiskeytobilingualormultilingualcorpusprocessingandfunctionaltranslationresourceconstruct!on.Thepapercxplainsthethcoricsbehindcorpusalignmentt

3、echnology,introduccstheclassificationofalignmenttools,andexaminesthemultipleapplicationsofthistechnologyintranslation-relateddomains.Itarguesthatlarge-scaletranslationresourcescanserveastheinfrastructureforconstructinganddevelopingthenationaltranslationcompetence.Keyword:alignmentte

4、chnology;translationresources;neitionaltrans1ationcompetence;infrastructure;Received:2017-07-31引言语料对齐(corpusalignment)是建立翻译记忆库的关键技术,即在双语或多语文本屮找到互相对应的源语文本和目标文本。翻译项冃结束后,译员或翻译公司应将原文和译文制作成双语或多语对齐语料,定期更新和维护翻译记忆库,作为语言资产妥善保存,在遇到相同或相近领域的翻译项目时,便可调取相应翻译记忆库,以节约投入的人力和物力,提升翻译项目的质量和效率。语料对齐不仅对于个体译

5、员和翻译公司具有重要作用,其至对于文化交流和知识传播亦具有基础性的支撑作用。1语料对齐技术的原理语料对齐指在两种或多种语言文木的不同语言单位之间建立对应关系,即确定源语文本的哪个语言单位和目标文本的哪个语言单位互为翻译关系in。从语言单位的大小来看,语料对齐可分为词汇级、句级和段落级对齐。不同的应用目的需要不同级别的对齐,女口:辞典的编纂需要词汇级的对齐;翻译工作者的语料库建设需要句级的对齐;在变译程度较高的双语文本,较难实现词汇级和句级对齐,则需进行段落级对齐。整体而言,现在的语料对齐工作主要以词汇级对齐和句级对齐为主。下面,介绍双语语料对齐所用到的主要技术

6、及其原理。l.i句级对齐技术句级对齐是翻译实践中更常用到的对齐模式,其工作原理主要包括如下三种:l.i.1基于长度的对齐方法基于长度的方法的原理是根据两种语言的长度比例对双语文木进行句子层面的对齐。使用该方法进行英法文本双语对齐,所得效果较好,但这种方法很难在亚洲语言(汉语、口语)与西方语言z间的语料对齐上产生良好效果図。鉴于此,Chuang和YehRl提出了基于标点符号的句子对齐法,经过汉英平行语料库的对齐实验,发现这一算法优于基于长度的对齐算法;该实验还证明,在共同的统计框架下同时使用基于标点和基于长度的两种算法,能够有效提升汉英双语文木对齐结果的准确度。

7、1.1.2基于词汇的对齐方法基于词汇的对齐方法由Kay和Rscheisen辺提出,其原理是在双语句对中寻找尽可能多的相对应的双语词汇,将对应数最大的句对对齐。在此基础上,Chen臣1构建了一对一词汇统计翻译模型,提高了对齐算法的准确率。Simard等回提出利用英法语句子中的同源词来对齐双语文本(英法文本)的方法,其原理是通过同源词作为锚点对双语文本进行定位,但受制于同源词的数量,其效果不如基于句子长度的方法更为理想。另外,由于汉英分属两个语系,无法使用同源词定位方法来提高对齐准确度。因此,基于同源词的对齐方法虽然在英法双语对齐上效果较好,但在汉英对齐上并非同样

8、有效。1.1.3混合式对齐方法基于长度

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。