资源描述:
《新型双语对应语料库的设计与构建》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、年!月中国翻译5,3046叉妈第∀卷第#期∃%&∋()(∗+姐,−./0/)102+∋.−05057−∀3#·语料库·新型双语对应语料库的设计与构建王克非,6北京外国语大学中国外语教育研究中心北京!89夕5!研制目的此,我们的设计既遵循语料库语言学的一般规律,又结合具体研制目标仔细加以考虑。总的说来,就是要将语本文介绍的新型双语对应语料库是北外全国重点人文料库的总体设计与语言和翻译研究并重这一主要目的高度社科研究基地中国外语教育研究中心近年创建的通用汉英。对应语料库。相关我们考察了国际上已建成的一些双语对应语料库,、:的情况根据
2、一库多用的建库目的和英汉语言特点开创建这一语料库的主要目的有三一是近二三十年。:国际上语料库语言学发展迅速,建立了各种用途的语料展研制工作总体考虑有如下十点、、:库,包括双语的平行库、类比库和翻译库,而我国在−=设计目的应用于语言研究翻译研究教学、。双语语料库的研制,;研究双语词典研编等上起步较晚有待于弥补其二是以:双语语料库收集、整理大量语言素材并赋以适当标注,=语库规模上述综合性的建库目的决定了其规模,。,应是大型的在数千万字词以上可以使研究者更充分地观察和分析语言与翻译现象探:<讨外语教学上的种种问题;其三是作为一个全国外语教=语料范围上
3、述建库目的决定了语料应是百科性,。育,的能反映语言全貌方面的重点研究基地我们的研究应当既有通盘的规:划,;=代表性与均衡性语料先区分为文学类和非文学和调研又有长远的基础研究项目这个基础研究须,、、,类两大类别文学类分小说散文戏剧6诗歌暂不同外语教学与研究具有密切的相关性和互补性而创建,、、大型双语平行对应语料库与此。收=次类非文学类分人文社会科学科学技术次正相适合,,为,。类并可再细分小类6见下面的一览表=同时充分此研制者开始了两年多的艰苦工作我们一方考虑各类的收录百分比。面全面考察和跟踪国内外语料库特别是双语对应语料库的、,∀:,,,=双语比例
4、全库包括汉语原创文本英语译本研制与应用一方面精心设计不断改进在北大计、,算语言学研究所的帮助,,和英语原创文本汉语译本四种文本其收录比例注意下前后处理上亿词次的语料、,。初步,协调均衡大体上是英译汉稍多于汉译英建成目前国际上规模最大的双语平行对应语料库,#=共时≅历时性:以共时为主即主要收二十世为我国外语界开展相关研究和在相关领域进行国际学术交,、,流奠定。纪语料英文可收录部分十八九世纪语料中文则了良好的基础,;下面就该语料库的设计思路、特点和构成作一简要基本为二十世纪的不收文言文语料所有语料均标注,。介绍。时代显示其历时特征:,Α=语言类型作为
5、建库第一阶段只考虑书面语5设计思路文本,暂不收口语语料。:,语料库的总体设计或研制方案,是决定今后语料库8=语言质量挑选语言质量高的原本特别注意,。研究和应用的关键。语料库如何选材,如何架构,往译本的质量力避太死板的直译和太活泛的意译:;往决定,9=取样策略抽样和全本收录兼顾前者适用于了语料库的后续发展甚至决定了能获取什么样、,,的研究成果6参,&∋(−.&+,!99!:!<。语言词典的研究后者适用于翻译研究和教学研究考=国内外单语;,语料库基本上是用于语言研究。翻译或双语平行语料库并适当考虑一本多译的收录约一万字以内的文本全,,,则倾向于翻译
6、研究;收取的语,本收录万字以上者随机抽样取样字数控制在万料大多数是综合性的即。历代的、百科的语料兼容并包。以双语库为例,英国字以内:曼彻斯特大学科技学院翻译研究中心的翻译语料库的语料!=标注加工首先做到英汉双语在句子层级上对,,;以叙事性文本为主6偏重文学=,是主要研究翻译的语齐可链接检索以方便各种研究上的需要其次是、;料库。该库在技术处理上,除了一般单语语料库的附码初步的分词处理和词性的标注并预留今后在句法语。标注外,还做了许多超语言信息的标注,如对译者情义等层面上深加工的余地;况、翻译方式、翻译类型、原书情况、出版社等等均这些设计上的考虑都
7、是逐渐完成的此后又进一步、、.,,加以标注6参看>?(+!999=但似未做句子层级上将总库细分为百科语料库专科语料库翻译文本库和,的对应。我们在总体研制上,应吸收他人的经验,又对译语句库等四个子库以便今后研究上既可统合使,,。考虑自,,。用又可分别使用6参看柯飞=己的需要有取有舍有学习有创新。语料库的总体设计是与建库目的密切相关的因<5研制特点,:一一由上述可知我们创建通用汉英对应语料库的一个收稿日期9!∀55中国翻译年第#期、。:,;《英根本设计理念是在研究上语言与翻译并重在语梦》国散文》等:、料,。非文学部分6约占Β=
8、收有《共产党宣言》上百科与专科兼收这是本库与目前国内外语料库、、、包括翻译语料库最主要的不同之处。这一语料库的特点《家庭私有制和国家的起