美国当代英语语料库(coca)使用介绍

美国当代英语语料库(coca)使用介绍

ID:21143176

大小:863.00 KB

页数:34页

时间:2018-10-18

美国当代英语语料库(coca)使用介绍_第1页
美国当代英语语料库(coca)使用介绍_第2页
美国当代英语语料库(coca)使用介绍_第3页
美国当代英语语料库(coca)使用介绍_第4页
美国当代英语语料库(coca)使用介绍_第5页
资源描述:

《美国当代英语语料库(coca)使用介绍》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、美国当代英语语料库(COCA)使用说明http://corpus.byu.edu/coca一、COCA语料库简介COCA简介COCA:美国当代英语语料库(CorpusofContemporaryAmericanEnglish)是由美国杨伯翰大学(BrighamYoungUniversity)的MarkDavies教授开发的美国最新当代英语语料库,是当今世界上最大的英语平衡语料库。COCA语料库简介涵盖美国这一时期的口语(spoken)、小说(fiction)、流行杂志(popmagzine)、报纸(newspaper)和学术期刊(academic)五大类型的语料库,并

2、且在这五个类型方面基本呈均匀平衡分布。COCA界面简介主要包括三大功能区:Ⅰ显示及查询条件界定区,包括:显示方式区,字串查询区,语料库分类区,查询结果排列方式区。Ⅱ查询结果数据显示区Ⅲ例句显示区COCA界面简介显示方式区:1.LIST——列表显示2.CHART——图表显示,可以显示在各语料库类型中的使用频率和各时间段内的使用情况。3.Concordances——Keywordincontext(KWIC),上下文关键词显示4.COMPARE——单词比较显示,比较两个不同词或短语的搭配情况。COCA界面简介字串查询区:ⅠWORDS:输入字符串。ⅡPOSLIST:词性列表

3、COCA界面简介语料库分类区(五大类型语料库共包括42个子语料库)。功能:此区可以对查询的字符串限定语料类型(Genre)和时段(Year),并且可以明确到查询某一个子语料库,时段也可以查询任何一年的某个字词的使用情况。COCA界面简介语料库分类区(五大类型语料库共包括42个子语料库)。COCA界面简介语料库分类区(五大类型语料库共包括42个子语料库)。COCA主要搜索功能(一)搜索words、phrases、lemmas(单词的所有形式)、wildcards(通配符)和其他更加复杂的字词。蓝色——名词紫色——动词绿色——形容词棕色——副词灰色——代词黄色——介词Co

4、ncordances显示方式COCA主要搜索功能例:输入词组“excuse+名词”得到的结果都是excuse后面跟的名词短。检索表达式为:white[n*]。图2.1.2-2White+名词的短语规则:名词:[n*];动词:[v*];形容词:[j*];副词:[r*];代词:[p*];连词:[c*]POSLIST词性列表noun.ALL=名词noun.SG=单数名词noun.PL=复数名词noun.CMN=普通名词noun.+PROP=专有名词noun.-PROP=非专有名词POSLISTPOSLISTverbbase=动词原形verb.INF=动词不定式verbMOD

5、AL=情态动词verb3SG=动词第三人称单数verbED=过去式verbEN=过去分词verbING=现在分词verb.LEX=lexicalverb实意动词verb.[BE]=系动词verb.[DO]=doverb.[HAVE]=havepron.INDF不定代词pron.PERS人称代词pron.WH疑问代词pron.REFL反身代词adj.CMP形容词比较级(comparative)adj.SPRL形容词最高级(superlative)adv.particle副词小品词adv.WH疑问副词POSLISTdet.GEN类指限定词det.POS物主限定词num.C

6、ARD基数词num.ORD序数词conj.CRD并列连词conj.SUB从属连词Interj.叹词PUNC标点POSLIST词性列表的使用某个词前或者后面特定词性的若干搭配词,如confidence前的形容词例:输入lemmas(即一个单词的单复数、时态等所有形式)。若要得到get这个单词的所有形式,可以如下图所示。COCA主要搜索功能规则:若要得到某个单词的所有单复数和时态形式,那么就要在输入时,在这个单词外加[]。EXAMPLE例:输入通配符(wildcards),输入un*ly,结果如图。?代替一个字母*代替任意数量字母EXAMPLE例:输入某种词性且部分带有某

7、些字母的命令,如要得到以un-开头、-ed结尾的所有形容词的所有形式,以及得到动词+任何词+ground的所有词组。规则:若要得到某种词性且词中带有部分带有某些字母的形式时,如要得到以un-开头、-ed结尾的所有形容词的所有形式,那么输入:un*ed.[j*];若要得到动词+任何词+ground的所有词组,那么输入:[v*]*[ground]即可。前者用来研究词汇,后者用来查询特定词性的搭配。un-开头、-ed结尾的所有形容词动词+任何词+ground的所有词组搜索搭配词和出现的频率如“go后跟的形容词”COCA主要搜索功能(二)规则:在colloc

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。