资源描述:
《_红楼梦_中英文平行语料库的创建》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、《当代语言学》第10卷2008年第4期329-339页,北京3《红楼梦》中英文平行语料库的创建刘泽权田璐刘超朋燕山大学提要《红楼梦》中英文平行语料库的建立,能够方便翻译学者充分利用语料库的诸多优势,系统、全面地进行研究。然而,在其创建过程中还存在包括建立语言模型、设计标记类别、双语句级对齐等诸多困难。本文结合我们在尝试解决这些问题时的具体思路和办法,探讨了对语料进行划分、标注、对齐等操作的可行性方案,旨在对中英文双语平行语料库的创建有所借鉴和帮助,为全面、系统地研究《红楼梦》及其三个译本提供一条有效途径。关键词《红楼梦》中英文平行语料库语料
2、标注句子划分句级对齐1.引言《红楼梦》中英文平行语料库的建立有助于对这一中华文学名著及其英译进行全面、系统、科学的研究。然而,在其创建过程中,仍存在着诸如软件开发运用、人工合理干预、句子标注属性确立及句法体系界定等问题。尤其在汉英双语句子对齐方面,通行的基于长度、词典或两者结合的方法(冯志伟2002:59),在处理如法律文本那样语言相当整齐、规范的语料时,尚可大展其能(吕学强等2004),但在《红楼梦》这一饱含中华文化语言特点的名著面前,却很难得到令人满意的结果。即使有些学者提出引入“位置信息”(李维刚等2006)、基于译文对齐(钱丽萍等2
3、000)等解决办法,但在一文多译的双语对应情况下,又会遇到不少困难,更何况文化词的问题还是不能得以解决。鉴于此,我们认为开发运用一种稳定便捷、操作性强的软件,进行必要的人工干预对语料进行标注和对齐,是目前解决典籍汉英语料库建立问题的最合理、高效的途径。本文介绍《红楼梦》中英文平行语料库的设计、建立及其应用,着重总结我们在语料库创建过程中所遇到的问题和挑战,以及在实践中摸索出来的解决办法,谨期在此过程中所积累的经验能为《红楼梦》其他语种和我国其他典籍的翻译研究提供借鉴和帮助。2.语料库的创建已建成的《红楼梦》中英文平行语料库的双语语料库可分可
4、合,既可作为一个中文语料库对应任何一个英文译本的双语平行语料库,又可作为各译本的单语语料库,分别用于汉英对照和英英对照研究。在实现段落和句子层面的对齐后,该语料库将会使研究者实现语句的自动链接式平行对应检索,以及应用语料库进行各项研究与统计分析,具体包括形符与类符3本文为国家社科基金项目“《红楼梦》中英文语料库的创建及应用研究”(项目批准号:05BYY028)阶段成果之一。本文在准备、写作以及对语料的标注过程中得到了新加坡南洋理工大学洪化清博士的技术支持。燕山大学信息学院刘国华教授及其领导的数据库研究小组对数据库的创建及网络检索平台的建设部
5、分提供了技术支持。另外,《当代语言学》匿名审稿人对本文的撰写提出了许多宝贵的修改意见。在此一并表示感谢。本刊网址:http://www.ddyyx.com329统计,词频排列,词长、句长、句数、句型、文体等语言特色的对比分析。2.1创建步骤《红楼梦》中英文平行语料库的创建分为以下几个步骤:(1)语料库的设计;(6)数据统计分析;(2)文本收集;(7)语料检索试用;(3)双语语料的预处理;(8)出版语料光盘及检索软件;(4)建立等价单位的索引;(9)开通基于互联网的检索平台。(5)等价单位的自动抽取;目前,语料库及网络检索平台尚未公布,有望在
6、解决版权问题后出版发行及对外开放。2.2问题及其解决办法尽管在《红楼梦》中英文平行语料库创建之初,我们已经预见到诸如语料选择、文本校对等各种问题,可在实际操作过程中,还会经常碰到涉及属性标注、句型界定及软件选择与运用等各种各样的具体问题。在此,我们把这些难题和试探性的解决方法作一介绍。2.2.1语料的选择由于《红楼梦》版本问题纷繁复杂,各译者所采用的底本也不尽相同。“前八十回杨宪益用的底本是有正本,或称戚序本。而霍克思的底本主要是程乙本,间或根据抄本,甚至有他自己的改动,因此他的本子其实是一种‘百衲本’”(范圣宇2004:20)。我们最终选
7、择了蔡义江校注本(曹雪芹1993,876000字)作为语料库的中文文本。原因有两方面:(1)这个版本是校注者通过大量认真细心的调查研究,“用现存的十余种本子互参互校,择善而从”出版的,旨在能“最接近曹雪芹原稿,同时又语言通顺,不悖情理,便于阅读,最少讹误”(曹雪芹1993:前言)。(2)这个版本也得到了许多红学家,如冯其庸(2001:340)、胡文彬(转引自田荣1999:92)的肯定。就《红楼梦》的英译而言,陈宏薇、江帆(2003:46)指出从1830年至1987年近160年间,出现了9种英译本,其中相当一部分都是片段翻译和节译本(2003
8、:51)。《红楼梦》的全译本主要有英国人乔利(Joly1892-1893)的前56回译本(简称乔译)、英国汉学家霍克斯和闵福德(HawkesandMinford1973-1986