基于平行语料库的中国特色词汇双语词表建设

基于平行语料库的中国特色词汇双语词表建设

ID:24543902

大小:60.44 KB

页数:3页

时间:2018-11-14

基于平行语料库的中国特色词汇双语词表建设_第1页
基于平行语料库的中国特色词汇双语词表建设_第2页
基于平行语料库的中国特色词汇双语词表建设_第3页
资源描述:

《基于平行语料库的中国特色词汇双语词表建设》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于平行语料库的中国特色词汇双语词表建设摘要:为了解决四六级新题型段落翻译中中国特色词汇翻译难问题,该研究使用《用英语说中国》系列丛书,建立微型汉英平行语料库,使用主题词生成软件和平行检索软件,建成中国特色词汇双语词表。文章简述了词表编制过程及该词表的应用。关键词:语料库;翻译;双语词表1引言新四六级考试中增加了汉译英段落翻译,根据大纲要求翻译内容涉及中国的历史、文化、经济、社会发展等。以2014年12月六级翻译为例,三套题目分别涉及到中国的经济发展,文学艺术以及教育三方面,其中出现了一系列具有中国特色的词汇,如计划经济、

2、市场经济、十二五规划、医保、道家、儒家、书生、吟诗作画、大学文凭、职业学院、欠发达地区和外来务工人员等。由于很难在英语中找到对应词,它们往往成为翻译中的障碍或难点。因此本研究计划利用《用英语说中国》系列丛书,建设中国特色词汇双语词表,以期规范翻译,辅助教学。2双语词表建设过程本研究所用文本收集自《用英语说中国》丛书,20082009年间由上海科学普及出版社发行,北京浩瀚英语研究所制作。共12册,50余万字,分别为历史、民俗、艺术、文化、名城、名人、旅游、体育、名校、影视、科技和经济。本丛书采用汉英对应的形式,旨在向外国友人

3、介绍中国并为中国的英语学习者提供帮助。下面简要介绍一下《用英语说中国》平行语料库的建设过程及双语词表的提取。首先,将该丛书扫描为电子文本,人工核对、去杂后整理成清洁文本。每本书包括若干个汉英文本,将12册书按内容整理成19个类别,分别为:旅游、名城、名人、名校、经济、古代科技、近代科技、古代史、近代史、传统体育、现代体育、国画、建筑、美食、民间表演、民间工艺、文学、影视及传统习俗。按类别加序号命名,分别整理成该丛书的汉英单语语料库。其次,采用句子对齐的级别,人工将汉英文本对齐。第三,利用北京外国语大学许家金教授研发的BFS

4、UPowerconc软件分别作出19个类别的汉语词表以及全套书的汉语词表,词表按词出现的高低排序。因为汉语分词问题较复杂,本研究分别选取了汉语的2词、3词、4词、5词及6词词表。第四,利用北京外国语大学梁茂成教授研发的keywordplus软件,将每类5个词表分别与总体的5个词表相比较,得出每个类别的5个主题词表,主题性按loglikelihood(对数似然率)从大到小排列,取对数似然率大于3.84的词1为古代科技类的4字主题词表。第五,人工检查每个类别的主题词表,去除无翻译意义的词。通过该方法获得的汉语主题词是由出现频率

5、决定的,因此不可避免地会遗漏一些出现频率不高的汉语文化主题词,为了弥补这一不足,可增补人工筛选的主题词,放在每个主题词表的最后。第六,利用Paracon软件,加载双语平行语料,检索所有主题词,记录其各种翻译形式,建成双语词表。如表1所示,以“传统习俗”类的2字和4字词表为例(篇幅所限仅取前10个词)。3结语为了解决四六级翻译中中国特色词汇翻译难问题,该研究使用《用英语说中国》系列丛书,建立微型汉英平行语料库,首先在汉语文本中找到关于中国历史文化经济等方面的19类主题词(每类分别取2字至6字的词),然后利用平行语料库检索软件

6、检索出这些主题词的各种翻译方法,建成双语词表。该词表具有以下优点:(1)基于真实文本,翻译较为系统准确。(2)主题词表的排列基于词频,出现频率高的词在前,符合习得顺序。(3)类别划分清晰,查找方便,可作为学生自学的素材。(4)教师还可利用该词表引导学生进行汉语文化主题词翻译方法和翻译策略的研究。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。