欢迎来到天天文库
浏览记录
ID:24203611
大小:50.50 KB
页数:4页
时间:2018-11-13
《基于平行语料库的科技术语英汉翻译研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于平行语料库的科技术语英汉翻译研究基于平行语料库的科技术语英汉翻译研究 1.引言 当今全球化进程中,国际间交往和互动频繁,作为发展中国家,中国在积极地引进和学习国外先进的科学技术,各个领域的外文科技 3.3词典无义项词 科技术语的翻译中,理想的是,仅利用传统的对比词典(如英汉电子词典)中列举的义项(或者经过标注说明特定用法的义项)与源语文本中的词语进行简单对应,从而得到相应译文。但是,在实际翻译过程中发现,传统词典在面对一个词项的多种用途时往往表现地无能为力,经常需要根据实际技术语境来创造新
2、词,这时则需要调用专业领域中独有的专业术语库。如rib一词在特定机械中称为筋板,而这个义项在传统词典中一直未予收录。 虽然人们已经总结出各种译法或思想,如音译法、意译法、形译法、意音兼顾法和创造新词法等,但是对于计算机而言,由于利用这些方法翻译时随机性和主观性较强,故很难且尚未能将这些译法或思想用程序的方式较好地表现出来。所以有赖于使用平行语料库等已存在并正在不断扩充、更新的大量语言事实进行归纳总结,择取较优译法或通用译法作为规范表达以用于机器翻译,从而使翻译语言达到正确性和一致性。 4.利用平行
3、语料库进行加工处理 在平行语料库中,首先,利用术语抽取技术,获取尽可能多的科技术语;然后,使用短语对齐技术实现这些术语的源语文本和目标语文本之间的对齐。这时,需要建立术语和领域相关性数据库、上下文相关性数据库,对数据库进行动态更新,另外,还需要考虑交叉领域的术语翻译。 4.1建立术语和领域相关性数据库 要建立同一科技术语与不同科技领域之间的相关性数据库,需要以下工作: (1)将汉英平行语料库中搜集的语料所属的领域进行分类,并标记其属性(如医学领域,可标记为英文;机械领域可标记为); (2)求
4、出某一个领域同一个科技术语的各种译法所出现的概率P;统一各种表达中出现概率最高的几种(最少一种)形成一小组,定为译语文本的候选规范表达; (3)将该术语的译文规范表达与该科技领域相关联,即一旦确定该科技领域,则当遇到该术语时,根据第二步统一翻译成此规范表达小组中的一个。 如下所示: [elbodash;{(医学)-->【肘】, (机械)-->【肘部】} [pedestal]{(建筑)-->【柱座】, (机械)-->【支座】
5、【基座】} [cell]{<BIO
6、GRAPH
7、Medicine="">(生物或医学)-->【细胞】, (电气)-->【电池】, (电子)-->【元件】, (机械)-->【容器】, (通讯)-->【手机】} 可以看出,同一英语科技术语也可以在不同的领域中译成同一汉语词语,这是由各领域之间的相近性和词语涵义的相对稳定性决定的。但这并不影响特定领域中的具体翻译。 4.2建立上下文相关性数据库 同一领域中,科技术语之间需要有上下文相关性数据库。科技术语之间有上下位概念相关、局部和整体相关、同级
8、相关等固有关系。由于这种固有关系,使得某些科技术语之间的彼此同现机率很高。同一领域中,很多词也有不同的翻译方法,而这些译法多数与上下文中同现的上述某些词语相关,所以可以用之以示区分。 例如,机械领域中tab有多种译法,但是如果上下文中出现或多次出现popcan(易拉罐),则意味着其意思是拉环的概率最大;如果上下文中出现或多次出现housing(壳体)或container(容器),则意味着tab的意思是凸舌的概率最大;如果前述二者都未出现,则音译表达提攀的概率最大。 由此可以在第一步的基础上,将规范
9、表达数组中的各个元素和其所在领域中同现的其它术语(或称特征词)通过计算最大概率而进行关联,即,如果在规范表达数组中同一领域同一特征词出现时有多个译法,则可以取最大概率者建立相关性。此处上下文同现指同一句子中同现、同一段中同现或者同一某一译法在其所有译法中所占的概率在相对稳定中也势必会发生相应的变化。我们必须利用各种有效的途径不断地扩充和完善科技术语相关性数据库。例如,依靠强大的搜索引擎功能搜集互联网上丰富的双语语料资源,并运用各种技术对所搜集的信息进行加工、处理和完善,以满足正确处理科技术语所满足的条
10、件。对于个体软件而言,可以利用翻译记忆机制,不断地记录翻译过程中所得到新的翻译结果,并实时地在后台进行整理归总,动态地得出用于后继科技术语翻译所需的数据。事实上,这一点已在一些翻译软件中初见端倪,如翻译记忆软件Trandos、Transit等。 4.4交叉领域中科技术语的处理 当今世界科技领域的发展已经不再是单纯的独立的发展,跨学科、跨领域的研究或技术开发已经成为是不可忽略的一大趋势。原来应用于两个特定领域的由同一源语词语表达的术语很有可能在同一篇跨
此文档下载收益归作者所有