语料库:俄语语言学理论和实践的新课题

语料库:俄语语言学理论和实践的新课题

ID:278748

大小:64.00 KB

页数:6页

时间:2017-07-17

语料库:俄语语言学理论和实践的新课题_第1页
语料库:俄语语言学理论和实践的新课题_第2页
语料库:俄语语言学理论和实践的新课题_第3页
语料库:俄语语言学理论和实践的新课题_第4页
语料库:俄语语言学理论和实践的新课题_第5页
资源描述:

《语料库:俄语语言学理论和实践的新课题》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、语料库:俄语语言学理论和实践的新课题提要:语料库语言学是随着计算机和网络技术发展应运而生的新的语言学研究方向或研究手段。世界上英语语料库的发展处于领先水平,但俄语语料库也有了长足的进步。俄语单语、俄汉双语、中国俄语学习者的俄语语料库对于中国俄语教学、俄语语言学研究、俄语教材编撰、俄汉互译、俄语水平测试都有重大意义,是当代俄语语言学理论与实践的新的重大课题。关键词:语料库;语料库语言学;俄语理论研究与实践1. 语料库简介1.1 基本概念归纳和演绎是语言学家经常使用的两种基本研究方法。采用归纳法进行语言学研究时,语言学家事先没有确定的理论或者

2、假定,他们从言语交际的实践中搜集有声或文字语料,加以整理、归纳,然后总结出一般的语言范式或者规律。演绎法则不同,语言学家心里有了一定的理论或者假定,然后去寻找语言事实,来证实或推翻原有的理论或者假定。定量和定性分析也是语言学研究的主要方法。定性分析要求对观察、搜集到的语料进行综合、归纳,提出一种描述的结论,发现规律或范式。定性分析的好处是观察、收集的资料很丰富、客观,描写深入、细致。定量分析主要有两种方法:统计法和实验法。通过统计或者实验,很容易验证一些语言学和教学理论的可信程度。定量分析的结论可信度高,具有普遍性。然而,无论采用什么方法

3、,语言事实、现象是语言学理论的根本,离开了语料,语言学研究就是无源之水,无本之木。计算机是二十世纪人类最伟大的发明之一,以计算机和网络为主的信息技术的发展向各个学科(包括语言学)提出了新的研究课题,也为各个学科的发展提供了新的手段和方法。语料库语言学(корпуснаялингвистика)便是随着计算机和网络技术发展而应运而生的新的语言学研究方向。语料库语言学代表的是一种传统的结构主义描写语言学方法,利用语料库可以对语言进行定量和定性描写。同时,语料库的语料也可以帮助验证语言学家通过演绎法提出的假定。语料库,顾名思义,就是存放语言材料

4、的仓库。目前,人们通常用语料库指存放在计算机里的未添加标记的原始文本或者经过加工添加了语言学信息标记的文本。现代语料库通常有下面四个特性:1)取样和代表性;2)有限的规模(选择性的条件);3)机器可读性;4)标准化的参考资料。语料库语言学有两层意思,一是利用语料库对语言的某个方面进行研究,这样,所谓“语料库语言学”实际上只是一种研究方法和角度;另一层意思是依据语料库所反映的语言事实进行语言学理论研究,只有在这个意义上“语料库语言学”才能成为一门学科。1.2 语料库的种类语料库可以根据不同的标准进行分类:按照媒体不同分为印刷文本、电子文本、

5、数字化言语、视频、混合型;按照建立方法不同分为平衡型、金字塔型、随机型;按照语言参数分为:单语和多语;原语和译语(匹配的和未匹配的);母语和学习者所掌握的外语;按照语言状态可以分为共时的和历时的;按照文本存放格式分为纯文本的和附码的。纯文本的语料库没有各种格式和语言特征标记(如字体、字形、字号、段落、分页符等),附码的文本主要带有各种语言学信息(语体、词类、句法结构、作者)。纯文本语料库具有广泛的适应性,而附码后的文本能够更好地满足语言研究的需要。JohnSinclair还提出了样本语料库和监控语料库的区分。样本语料库收集的语料是不变的,

6、而监控语料库的内容则处于不断发展之中。建立什么样的语料库取决于许多因素,比如建库目的、最终用户类型、资金和技术、研究水平,等等。1.3 语料库采用电子形式的好处采用电子形式的文本有很多优点:容易访问,便于携带;与用眼睛阅读相比,计算机处理电子文本的速度快得多;计算机处理电子文本的准确性一般要高得多;可以很容易地为电子文本增添其它信息;满足社会发展的新需要(如建立电子词典、提供网络服务等)。尽管任何形式的文本材料的汇集都可以称为语料库,但是,在今天这个发展水平上,语料库一般都是电子形式的。2.语料库的发展情况2.1 英语语料库的发展情况计算

7、机和网络技术是英美各国的强项,英语又是国际通用语言,所以英语语料库的规模最大,理论和技术也最成熟,并且已经得到了实际应用。目前,国际上将英语语料库分为两代:第一代英语语料库有:2.1.1 布朗语料库(TheBrownCorpus)布朗语料库(BrownUniversityStandardCorpusofPresent-DayAmericanEnglish)于1961年在美国建成。这是第一个机器可读的语料库。1957年乔姆斯基的《句法结构》发表,当时很多的学者认为,语言学理论应该研究人类的语言能力(linguisticcompetence)

8、,而不是记录和研究交际者的语言行为,即语言表现(linguisticperformance)。语料库语言学的哲学理论基础显然与转换生成语法所代表的哲学思想相背,在这一背景下,布朗语料库的建立具

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。