资源描述:
《文学语言文学毕业论文 浅谈语料库语言学在的应用以及在中国的发展趋势》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、湖南师范大学本科毕业论文考籍号:XXXXXXXXX姓名:XXX专业:文学语言文学论文题目:浅谈语料库语言学在的应用以及在中国的发展趋势指导老师:XXX二〇一一年十二月十日 论文关键词:语料库 语料库语言学 理论基础 论文摘要:本文通过对语料库语言学发展的探讨,简要介绍了语料库语言学的应用,其中主要阐述了其在外语教学研究及词典编纂方面的应用。同时文章展望了该学科的发展前景,指出了其存在的相关问题。 一、语料库语言学的兴起与发展 语料库语言学是基于大量真实的语言资料,从调查语言信息的分布频率入手来研究语言在现实使用中的规律
2、和模式。自20世纪中后期,电脑被大量使用在语料的存储上,兴起了专门针对大规模储存于计算机里的语料库所进行的研究,自此语料库语言学进入了现代语料库语言学时期。由于电脑语料库容量大、语料真实、检索快捷,它在现代语言学研究和语言教育中正发挥着越来越重要的作用。 在我国,从20世纪20年代开始,有学者为制定基础汉字字表开始建立文本语料库;70年代末以来,汉语现代文学作品语料库(1979年)、现代汉语语料库(1983年)等机器可读语料库开始建设。90年代后,以《人民日报》光盘数据库、北大语料库为代表的大型汉语语料库日益发展,语料库成为研
3、究中文信息处理的基本语言资源。在英语语料库建设方面,杨惠中教授80年代主持建成的上海交通大学科技英语语料库(JDEST),是当时世界上第一个同类语料库,也是国内最大最完备的英语语料库之一。1996年广州外国语学院开始建立中国学生交际英语语料库。此外由广东外语外贸大学桂诗春教授和上海交通大学杨惠中教授牵头开发的“中国学习者语料库”(CLEC)于1999年建成,该语料库广泛收集了包括我国中学生、大学生在内的一百多万词的各种书面语资料,并对所有的语料进行语法标注和言语失误标注,对研究中国学习者的英语特点具有开创性意义。 二、语料库语
4、言学发展趋势 语料库语言学研究的发展总是以语料库的建设为基础的。没有语料库的建设,语料库语言学所进行的研究只能是纸上谈兵。近十多年来,国内语料库的建设取得了一定的成就,主要建设的语料库有英语学习者语料库、平行语料库、特殊英语语料库、汉语语料库四种类型。 (一)英语学习者语料库。其中包括书面语和口语。有广东外语外贸大学和上海交通大学合作建设的中国学习者英语语料库CLEC,100万词次;上海交通大学建设的大学英语学习者口语语料库COLSEC,5万词次;香港科技大学建设的香港科技大学学习者语料库HKUSTLearnerCorpus
5、;南京大学建设的中国英语专业语料库CEMC,148万词次;南京大学建设的中国英语学习者口语语料库SECCL,100万词次;华中科技大学建设的硕士写作语料库MWC,12万词次。 (二)平行语料库。有北京外国语大学建设的汉英平行语料库PCCE;南京大学建设的南大———国关平行语料库;外语教学与研究出版社建设的英汉文学作品语料库,冯友兰《中国哲学史》汉英对照语料库,李约瑟(JoselfNeedham)《中国科学技术史》英汉对照语料库;北京大学计算语言学研究所建设的双语语料库,5万多对;香港城市理工大学建设的对比语料库LIVAC;台湾
6、建设的平衡语料库SinicaCorpus和树图语料库SinicaTreebank;国家语言文字工作委员会应用研究所建设的计算机专业的双语语料库,柏拉图(Plato)哲学名著《理想国》的双语语料库;中国科学院软件研究所建设的英汉双语语料库,15万对;中国科学院自动化研究所建设的英汉双语语料库,包含LDC香港新闻硬汉双语对齐语料36294段以及香港法律英汉双语对齐语料31万句子对,并从英汉双解词典中摘取例句25000个句子对。 (三)特殊英语语料库。有河南师范大学建设的中国英语(ChinaEnglish)语料库;解放军外语学院建设
7、的军事英语语料库(CorpusofMilitaryTexts);上海交通大学建设的新视野大学英语教材语料库。 日前国内语料库语言学的研究也呈现出一些新的发展趋势,表现为:(1)学习者语料库的建设与中介语的研究是今后语料库语言学研究的重点之一;(2)口语语料库的建设和相关话语特征分析已成为该学科的发展方向;(3)平行语料库建设与研究代表了当今基于语料库方法进行语言对比研究、翻译研究和外语教学研究的发展趋势;(4)语料库建设日益呈现出普遍性特点;(5)语料库研究不断向纵深发展。 综上,国内语料库语言学通过多年的发展,无论是在语料
8、库的利用上还是研究方法上都取得了长足的进步,但同时我们也应看到存在的一些问题:如在各研究领域发展欠平衡,有些研究语料库的选取不够恰当,采取的统计方法还不够严谨等。但语料库语言学的兴起及其作用正如应用语言学家McCarthy所说的那样:“它是先进技术和方法的代表,