中国英语学习者的语料库CLEC 桂诗春 杨惠中

中国英语学习者的语料库CLEC 桂诗春 杨惠中

ID:48338361

大小:381.02 KB

页数:10页

时间:2019-10-26

中国英语学习者的语料库CLEC 桂诗春 杨惠中_第1页
中国英语学习者的语料库CLEC 桂诗春 杨惠中_第2页
中国英语学习者的语料库CLEC 桂诗春 杨惠中_第3页
中国英语学习者的语料库CLEC 桂诗春 杨惠中_第4页
中国英语学习者的语料库CLEC 桂诗春 杨惠中_第5页
资源描述:

《中国英语学习者的语料库CLEC 桂诗春 杨惠中》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、中国英语学习者语料库CLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词,并对言语失误进行标注。其目的就是观察各类学生的英语特征和言语失误的情况,希望通过定量和定性的方法对中国学习者英语作出较为精确的描写,为我国学生的英语教学提供有用的反馈信息。表1CLEC语料分布类型词次ST2208088ST3209043ST4212855ST5214510ST6226106总计1070602  言语失误标注原则 1.        简单合理,易于系统操作。参与标注的人比较多,分类表过于繁复,就难于掌握。我们采取两级分类,第一级有11类:词形(fm)、动

2、词短语(vp)、名词短语(np)、代词(pr)、形容词短语(aj)、副词(ad)、介词短语(pp)、连词(cj)、词汇(wd)、搭配(cc)、句子(sn)。每一类里再用数目字细分。如[cc]为词语搭配不当,[cc1]表示名词和名词的搭配,[cc2]表示名词和动词的搭配,[cc3]表示动词和名词的搭配,等等。 2.        分类表的类别要适中。过粗容易统一,但信息太少,不利于分析学习者的失误/过细难以统一,容易把同一种失误归到不同类别。目前我们采取的办法是对常见的失误从细(如vp和np都有9小类),对少见的失误从粗(如cj只有两小类)。现在的分类表有61个失误码,是属于中等规模的分

3、类表。 3.     提供足够的失误信息(失误本身、失误类型和失误发生范围)。例如Inthepast,peopleare[vp6,4-]kindtoeachother…,失误用方括号表示,放在失误之后。[vp6]Inthepast,peopleare[vp6,4-]kindtoeachother……,[vp6,4-]are为vp(动词)第6种(时态)失误,4-为失误发生的范围,-表示失误的位置,4表示失误前有4个词。要联系这4个词,才能判断areare这个词用错了。 4.     开放性。容许研究者根据需要对失误类型进行补充或进一步再分出细类。例如[sn8]为句子结构有缺陷,研究者可以

4、对这种失误再分为若干细类来研究。这需要把sn8的失误全部检索出来,然后定出第三级的分类范畴,如sn81,sn82,等等。5.        对语体或失误的来由暂不作标注,因为这需要标注者较多的主观判断,更难以统一。言语失误分类表(总数:61)词形动词短语名词短语代词码类型码类型码类型码类型fm1Spellingvp1patternnp1patternpr1Referencefm2wordbuildingvp2setphrasenp2setphrasepr2anticipatoryitfm3capitalizationvp3agreementnp3agreementpr3Agreemen

5、t  vp4finite/non-finitenp4casepr4Case  vp5non-finitenp5countabilitypr5wh-  vp6tensenp6numberpr6Indefinite  vp7voicenp7article    vp8moodnp8quantifiers    vp9modal/auxiliarynp9otherdeterminers  形容词短语副词介词短语连词码类型码类型码类型码类型aj1patternad1orderpp1patterncj1patternaj2setphrasead2modificationpp2setphrasec

6、j2setphraseaj3degreead3degree    aj4-ed/-ingconfusion      aj5predicative/attributive      词语搭配句子码类型码类型码类型wd1ordercc1noun/nounsn1run-onsentencewd2partofspeechcc2noun/verbsn2sentencefragmentwd3substitutioncc3verb/nounsn3danglingmodifierwd4absencecc4adj/nounsn4illogicalcomparisonwd5redundancycc5ve

7、rb/advsn5topicprominencewd6repetitioncc6adv/adjsn6Coordinationwd7ambiguity  sn7Subordination    sn8structuraldeficiency    sn9Punctuation         标注说明码分类类别说明fm1wordSpelling(拼写)spelling,coinage,abbreviation,apostrophefm2wordw

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。