欢迎来到天天文库
浏览记录
ID:9653251
大小:52.50 KB
页数:4页
时间:2018-05-04
《译文分析的语料库途径》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、译文分析的语料库途径 提要:译文分析的语料库途径是通过融合定量研究和定性研究,用特定的文本分析软件对翻译文本进行词汇、句法、语篇和修辞等层面的实证分析。本文探讨基于语料库的译文分析的可行性和实现途径,并以《茶馆》的英若诚译文和霍华译文为语料,对比分析两译文的用词特征。 关键词:译文分析;语料库;用词特征 CorpusbasedApproachtoTranslationAnalysis icroConcord等。索引工具的基本功能包括词表生成、语篇统计、带语境的关键词(K.获得译文在词汇、句法、篇章和
2、修辞等方面的统计信息。如词汇方面,研究者可进行用词变化、平均词长、词汇密度、常用词表等方面的分析;句法方面,研究者可对译文的平均句长、复杂句、缩略形式、标点符号等进行分析;语篇方面,研究者可进行词汇衔接的量化分析。翻译文本多层面、全方位定量分析,为翻译批评提供可靠的量化依据。 3《茶馆》两译文用词特征个案分析 本研究以《茶馆》的英若诚译文和霍华译文为语料,对比分析两译文的用词特征。为了更好地比较两译文,还选用英语本族语语料库BNC作为参照语料库。 首先对英若诚译文和霍华译文进行扫描、校对并分别保存为纯文本文件,然
3、后用CLAithTools的相关程序对两译文子库进行检索,得到译文在类符形符比(typetokenratio)、平均词长、词汇密度、常用词表等相关信息,通过这些信息考察《茶馆》两译文的用词特征。 3.1用词变化 语料库语言学主要通过类符形符比考察文本的用词变化情况。类符(type)是语料库中不同的词语,形符(token)是语料库中所有的词形。类符形符比在一定程度上反映了语料的用词变化。类符形符比值越大,表明该文本使用的不同词汇量越大;反之,不同词汇越少。通过类符形符比值的大小可以比较不同语料库中词汇变化的大小
4、。但由于在一定时期内语言的词汇量有限,若语料库容量不断扩大,形符数会持续增加,而类符数却不一定会增加,从而导致语料库容量越大,类符形符比值反而越来越小,因而不同容量的语料库的类符形符比不具备可比性。所以,语料库语言学一般用标准类符形符比(standardtypetokenratio)衡量语料库的词汇变化,即按一定长度(通常是1000个形符)分批计算文本的类符形符比,再求平均值。下表是通过ith软件统计的《茶馆》两英译文语料库和BNC语料库的类符形符情况。 从表1可知,英译文的形符数为22,211,霍译文的形
5、符数为22,714,BNC语料库的形符数为102,467,488。英译文的类符数为3,031,霍译文的类符数为3,040,BNC语料库的类符数为166,962。再看标准类符形符比,英译文的标准类符形符比为42.16,霍译文的标准类符形符比为40.99,BNC语料库为41.20。从这3个数字可以看出,英译文的标准类符形符最高,其次为BNC和霍译文。这表明:(1)英译文用词范围更加宽泛,表达方式更加生动;(2)霍译文用词范围相对狭窄,但更接近本族与使用者用词变化。 3.2平均词长 平均词长是西文文本中类符的平均长度
6、。通常情况下,平均词长较长说明文本中用的长词、常见文本中分别由2、3、4、5个字母组成的单词较多,平均词长在4左右。如果低于4,意味着文章语言比较简洁浅显。如果远高于4,意味着文章语言比较复杂深奥。可见,词长反映用词的复杂程度。3个语料库的平均词长分别为4.19、4.35和4.54。这表明,3个语料库在平均词长方面接近,总体用词难度没有什么区别,霍译文用词复杂程度更接近本族语使用者,英译文用词复杂程度略底于本族语使用者。 为了更详细地描写语料库各长度词的使用情况,ith软件在作词频统计时会自动计算出各长度词在语料
7、库中的使用频率。但如果语料库的容量不一样,语料库的实际词长出现次数就不具可比性。所以,我们采用每1000词词长数,即每1000词不同长度的单词在语料库中出现的次数。这种方法可更客观地比较各长度词在不同语料库中的分布情况。表2是各长度词在英译文、霍译文和BNC语料库的每千词分布情况。结果显示,英译文的每千词中1-4个字母长度词均高于霍华译文,而霍华译文每千词中5-10个字母长度词均高于英译文。 5个字母词以上(含5个字母)的词属于难度较大的词。我们把上表中各语料库中5个字母词以上(含5个字母)的词的每千词的出现频
8、率相加,得到如下数据:英译文为342.02/千词,霍译文为384.6/千词,BNC为399.8/千词。这些数据反映3个语料库使用难度词在总体上有一定差别:霍译文用词难度大于英译文,而两译文的用词难度又都小于本族语使用者。 3.3词汇密度 词汇密度指实词在语料库中占的比例,其计算方法为:实词÷总词数100%。英语实义词指具有稳定词汇意
此文档下载收益归作者所有