语料库论文 中国英语新闻报刊中的词簇[marked]

语料库论文 中国英语新闻报刊中的词簇[marked]

ID:5293548

大小:312.90 KB

页数:6页

时间:2017-12-07

语料库论文 中国英语新闻报刊中的词簇[marked]_第1页
语料库论文 中国英语新闻报刊中的词簇[marked]_第2页
语料库论文 中国英语新闻报刊中的词簇[marked]_第3页
语料库论文 中国英语新闻报刊中的词簇[marked]_第4页
语料库论文 中国英语新闻报刊中的词簇[marked]_第5页
资源描述:

《语料库论文 中国英语新闻报刊中的词簇[marked]》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国英语新闻报刊中的词簇①李文中河南师范大学摘要:为先导研究之目的,建立一个“中国英语新闻语料库”(CENAC),并提取各种长度的词簇,通过与对应的“英国英语新闻语料库”(BENAC)对比分析,调查中国语境中词簇的分布特征及语用功能。研究发现CENAC中使用更多的长词簇,这些词簇结构固定,意义具体,具有很强的表达能力。同时,这些词簇在语言和社会文化方面本土化特征明显,但不易为国际读者所理解。对外语学习者而言,充分掌握现成的模块化表达,有助于提高学习者的交际信心和流利程度。主题词:多词单位;词簇;CENAC;中国英语中图分类号:H31文献标识码:A文章编号:1672-9382(2007)03

2、-0038-06更地道。研究者们认为,学习者口语流利的程度1引言取决于对“体制化”多词词组的掌握(参见所谓“词簇”(wordcluster)即文本中两个Hunston&Francis,2000:10)。近年来,我国或两个以上的词形以固定的组合关系(或位置)的外语研究者重点放在自主开发的学习者语料重复同现。在操作定义上讲,词簇具有以下3个库,以错误分析入手,或采用对比中介语分析方特征:(1)必须是两个以上词形的多词单位的同法,调查和分析中国学习者英语中词语运用主要现;(2)该多词单位是线性连续的;以及(3)至特征和困难,如关于搭配与语义韵的研究(卫乃作者简介:李文中,少出现两次以上。与词簇意

3、义相同的其他术语还兴,2001)、关于学习者英语动词模式和词块有“N词(字)串”(N-gram)②、“多词单位”(chunks)的研究(濮建忠,2002)及对词语组河南师范大学外国(multiwordunits)、“复现词组”(recurrent合及搭配的研究(李文中,1999)。但以上研究语学院教授。研究word-combinations),以及与词簇意义相近的主要围绕语言运用,以第三者视角研究和调查多方向:语料库语言“搭配”(collocation)③等。说“词语像人类一样词词组在文本中的频率、形式和功能。学、应用语言学、计聚群”,只是从词语角度来观察词语同现,实际在文本处理中,对多词

4、单位的识别和统计算机辅助教学。上,词簇现象体现了语言运用的预制性、惯例性却刚迈出第一步。“词簇”或“N-gram”与其他Email:li.wzhong及模块化特征。概念的不同就在于,它只关心两个特征:连续的May2007Vol.4No.3(GeneralSerialNo.17)@gmail.com。在应用语言学界,由于多词词组的预制性词串同现,以及重复的频数。对于词簇的统计结和重复性,在语言运用中有效使用多词词组显得果,先存的理论模型或框架似乎难以适用。如词FLC38中国外语簇的构成,如何准确识别核心结构与外延结构,形符数就可得出。另外,词簇的分布信息也可以如何处理词簇内部的变异。在基于语

5、料库的多词用该词簇出现的文本数除以总文本数计算出来。第2007单位研究中,词簇是一切观察的起点。本研究采如词簇“doyouthink”在某个口语语料库中的4卷年用Scott(2005)所给出的定义,词簇是“在文频数是1022次,该语料库总量为770270个词,第5月3期本中前后相接的一组词”,“他们重复同现,显示则该词簇的频率就是0.13%;该语料库含302个(出比搭配词更为紧密的关系,并与词组或短语相文本,而该词簇在其中290个文本中都有分布,总第17近”(2005:help)。在语料库研究中,把文本以其分布频率则为96%。在WordsmithTools中,期)不同长度词簇进行全程切割,

6、并计算每一长度词利用其Wordlist功能生成索引文件(indexfile),簇的频率。词簇传达的信息更完整,提供的语境并利用该文件再生成所需的各种长度的词簇表。信息更丰富,也更易于识别和描述。在切割词簇时,Wordsmith会按照要求,以句子标点为中止符,这样不会出现跨越句子甚至段落的词簇。本研究对词簇长度最大值设定为八词,2研究目的因为我们发现高于该值的词簇无论在BENAC还本研究旨在调查中国英文报刊文章中词簇是在CENAC中都非常少见。在每个N词词簇表的典型模式,并观察中国本土化英语词簇中的基中,统计出各个词簇的频数和百分率,最小频数本特征。研究问题包括:在中国社会、政治及文设定为5

7、(Frequency>5),以保证所生成的每个化环境中英语词簇运用在多大程度上发生本地词簇的可靠性。对BENAC作相同处理,生成相化?这种词簇的长度变化特征有哪些?在意义表同数目的N词词簇表。述中呈现哪些主要特征?这些本地化词簇之于中第三步,为获得中国英文报刊中最常用的国外语教学潜在的功能和意义是什么?本研究作词簇,需要拿两个语料库的各个N词词簇表进行为“中国英语语料库”(CEC)的前导研究之一。对比,这样,CENAC中

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。