资源描述:
《基于语料库同义词辨析的一般方法_张继东》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第28卷第6期解放军外国语学院学报Vo.l28No.62005年11月JournalofPLAUniversityofForeignLanguagesNov2005基于语料库同义词辨析的一般方法12张继东,刘萍(1.东华大学外语学院,上海200051;2.上海交通大学技术学院,上海200231)摘要:基于语料库的同义词辨析方法包括:(1)统计出同义词在语料库的不同语域中的词频分布差异;(2)以节点词的跨距为参照,统计同义词的显著搭配词,并计算同义词与其搭配词相互信息值(MI值)以及Z值;
2、(3)通过观察检索行中所呈现的同义词搭配特征,揭示出它们的类联结、搭配关系和语义韵等语言特征。关键词:同义词;语料库;语域;搭配;语义韵中图分类号:H3132文献标识码:A文章编号:1002722X(2005)06004904CorpusbasedApproachestotheDifferentiationofEnglishSynonyms12ZHANGJidong,LIUPing(1.CollegeofForeignLanguages,DonghuaUniversity,Sh
3、angha,i200051,China;2.TechnicalSchoo,lShanghaiJiaoTongUniversity,Shangha,i200231,China)Abstract:Withincorpusbasedapproaches,synonymscanbedifferentiatedwithreferenceto:1)theirdistributionsamongdifferentregisters;2)theirsignificantcollocates,andtheMIva
4、lueandZscorebetweensynonymsandtheircollocates;3)theircollocationalbehaviorsandsemanticprosodieswithregardtocertaincolligationalframeworks.Synonymsthusdifferentiatedwillhavesignificantpedagogicalimplications.KeyWords:synonym;corpora;register;collocatio
5、n;semanticprosody0.引言1.基于英语语料库的同义词辨析英语是世界上使用最广泛的语言之一,其词汇11同义词在不同语域中词频分布差异量极其庞大,其中同义词占有很大比例,是语言学语域是人们在实际的语言活动中,出于交际的习的难点。据统计,英语语言中同义词、近义词的需要,或因其所从事的职业和兴趣相异,亦或因其数量约占总词汇量的60%以上(贺晓东,2003),它话语发生的情景、说话的对象、地点和话题的不同们通过词形、词义、结构或用法等方方面面的相同而产生的一种言语变体,体现为语言中的不
6、同语体或相近构成了庞大的英语词汇体系,切实学懂、用风格、用语格调等。同义词由于其内在意义的差熟同义词是突破英语词汇的重要环节,更是提高英异,在不同的语域中往往会呈现出不同的分布特语写作、阅读、会话等技能的关键。征,所以统计它们不同语域中的频率差异,有助于传统的同义词辨析方法,多依赖于直觉经验,将它们区分开来。采用内省的定性方法,对同义词的词目意义条分缕为了说明同义词在不同语域中的分布频率对同析,然而,一般的语言学习者在实际的运用中似乎义词的辨析具有宏观指导作用,本文选取了一组同仍然难得要领。本文拟
7、从语料库语言学的角度,通义形容词:big、great、large,对朗文英语口语和过对相关的语料库进行检索统计,发现同义词在不书面语语料库(简称LGSWE)所提供的数据进行同语域中的词频分布差异,计算出词语搭配的不同搜集,按会话、小说、新闻、学术文章四个语域进相互信息值,通过观察检索行中所呈现的同义词搭行分类。配特征,揭示出它们不同的类联结、搭配关系和语big、grea、tlarge之间的词义差异,学习者似乎义韵等语言特征。能够直接从词典类工具书中就可以查询出来,但是收稿日期:2005-3-2
8、8作者简介:1.张继东(1965-),男,安徽安庆人,东华大学外语学院讲师,研究方向为语料库语言学;2.刘萍(1965-),女,安徽芜湖人,上海交通大学技术学院副教授,研究方向为语料库语言学与英语教学法。50解放军外国语学院学报2005年一般的工具书对于词汇附加信息的语域分布信息却表示有搭配联系,值越大,关系越密切。没有涉及。从LGSWE每百万词中的显示频率来看,首先,我们对large的搭配词计算MI值(见表我们发现big、great、large三词在以上四个语域中2),发