我与计算语言学的缘分

我与计算语言学的缘分

ID:32385175

大小:130.36 KB

页数:3页

时间:2019-02-04

我与计算语言学的缘分_第1页
我与计算语言学的缘分_第2页
我与计算语言学的缘分_第3页
资源描述:

《我与计算语言学的缘分》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、《现代语文》,2007年第9期(总第282期),p127-128我与计算语言学的缘分冯志伟计算语言学是一个横跨语言学、数学和计算机科学的交叉学科。语言学和数学都是有着相当长历史的古老学科。语言学历来被看作是典型的人文科学,数学则被许多人看作是最重要的自然科学。在学校教育中,语文和数学被认为是两门最基础的学科,成为任何一个受教育者的必修课。它们似乎成了学校教育的两个极点:一个极点是作为文科代表者的语文,另一个极点是作为理科代表者的数学。很少有人想到,这两门表面上如此不同的学科之间竟然会存在着深刻的学术联系。计算机科学是研究计算机的新兴学科,带有相当强的工程性质和浓

2、烈的技术色彩,属于高科技的范畴,表面上看来,作为典型的人文科学的语言学与属于高科技的计算机科学也不会存在什么瓜葛。因此,在一般人的心目中,这门横跨语言学、数学和计算机科学的计算语言学似乎是不可思议的,甚至是有悖于常识的,就是连“计算语言学”这个名称也几乎是荒谬绝伦的。然而,一些具有远见卓识的学者却早就洞察了语言学、数学和计算机科学之间的紧密联系。1847年,俄国数学家布里亚柯夫斯基(В.Я.Буляковский)提出了用概率方法来进行语法、词源及语言历史比较研究的思想。1894年,瑞士语言学家索绪尔(DeSaussure)指出,“在基本性质方面,语言中的量和量

3、之间的关系可以用数学公式有规律地表达出来”,后来,他在其名著《普通语言学教程》(1916年)中又指出,语言学好比一个几何系统,“它可以归结为一些待证的定理”。1904年,波兰语言学家博杜恩.德.库尔特内(BaudouindeCourtenay)认为,语言学家不仅应该掌握初等数学,而且还有必要掌握高等数学。他表示坚信,语言学将日益接近精密科学,语言学将根据数学的模式,一方面“更多地扩展量的概念”,一方面“将发展新的演绎思想的方法”。1933年,美国语言学家布龙菲尔德(L.Bloomfield)提出了一个著名的论点:“数学只不过是语言所能到达的最高境界”。法国数学家

4、阿达玛(J.Hadamard)说得更好:“语言学是数学和人文科学之间的桥梁”,他一语道破了语言学和数学之间的联系,并清楚地看出了语言学是人文科学中最容易与数学建立联系的学科。著名俄国数学家马尔可夫(A.A.Марков)更是躬行实践,他在1913年把普希金的叙事长诗《欧根·奥涅金》中的连续字母加以分类,研究俄语字母序列内部的关系,提出了马尔可夫随机过程论,后来成为了一个独立的数学分支,对现代数学的发展产生了深远的影响。语言结构中蕴藏着的数学规律,成为了马尔可夫创造性思想的取之不尽的源泉。1946年第一台电子计算机ENIAC在美国研制成功。就在电子计算机问世的同一

5、年,英国工程师布斯(A.D.Booth)和美国洛克菲勒基金会副总裁韦弗(W.Weaver)在讨论电子计算机的应用范围时,就提出了利用计算机进行语言自动翻译的想法。韦弗在1947年3月4日给控制论学者维纳(N.Wiener)的信中说:“我怀疑是否真的建造不出一部能够作翻译的计算机?即使只能翻译科学性的文章(在语义上问题较少),或是翻译出来的结果不怎么优雅(但能够理解),对我而言都值得一试。”可见,电子计算机一出现,计算机科学家的慧眼就投到了自然语言的自动处理方面。这样看来,语言学、数学和计算机科学之间确实有着深刻的内在联系,那么,作为一门横跨语言学、数学和计算机科

6、学的计算语言学的存在便应该是合情合理的了。我是一个普通的凡人,当然不可能有上述学者那样的远见卓识。我是在一个偶然的机会与计算语言学结下了不解之缘的。这里,我愿意说一说我与计算语言学的这种缘分。我于1957年高中毕业后,考入北京大学地球化学专业本科就读,当时我非常崇拜俄罗斯地球化学家费尔斯曼(Felsman),一心想研究化学元素在地球上的分布规律。就当我在北京大学认真学习地球化学的前后,国外兴起了数理语言学,建立起了完善的理论和方法,并且在许多大学中开设了数理语言学的课程。数理语言学作为一个独立的学科出现在现代语言学的百花园中。在五十年代虽然还没有出现“计算语言学

7、”这个名称,但是,数理语言学与后来出现的计算语言学有着密切的联系。北京大学高举五四“民主”和“科学”的大旗,学术空气非常自由,北京大学的图书馆藏书丰富,学生可以阅读到各种最新的科学杂志,了解到国内外最新的学术发展动向。当时我才十九岁,求知的愿望非常强烈,对于新事物极为敏感,我成为了北京大学图书馆的常客,整天泡在图书馆的书海之中。一个偶然的机会,我在北京大学图书馆馆藏的1956年出版的美国《信息论》(IRETransaction,InformationTheory)杂志上,读到了美国语言学家乔姆斯基(N.Chomsky)的论文《语言描写的三个模型》(Threemo

8、delsforthede

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。