欢迎来到天天文库
浏览记录
ID:44375233
大小:28.00 KB
页数:4页
时间:2019-10-21
《《计算语言学》简评文库》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、《计算语言学》简评[摘要]计算语言学是一门横跨语言学、数学和计算机科学的边缘性交叉学科。《计算语言学》是清华人学中国语言文学系刘颖教授的新作,该书系统介绍了计算语言学的相关理论及计算方法。从方法论视角看,该书对推动语言学或计算语言学学科建设及发展具有重要意义。[关键词]计算语言学;计算机科学;交叉学科[中图分类号JG642[文献标识码]A[文章编号]1671-5918(2015)13-0122-03计算语言学(ComputationalLinguistics)是当代语言学中的一个新兴学科。《计算语言学》是清华大学中国语言文学系刘颖教授的一部新作,
2、由清华大学出版社于2014年9月出版。刘颖教授研究计算语言学、自然语言处理和机器翻译多年,已岀版着作四部,发表相关专业论文近六I•篇。本书是2002年10月岀版的《计算语言学》的修订版本,全书系统介绍了计算语言学的相关理论与计算方法,以及统计语言学与机器翻译的相关理论。近I•儿年來,国内对于计算语言学的相关著作尤其是系统性介绍的书籍还是为数不多的,许多对计算语言学感兴趣的研究者们迫切需要这样的一本较为全面性的书籍问世。相信本书应该会受到计算语言学界学者及研究者的极大关注。本文首先探讨计算语言学的背景,Z后简要介绍该书各章节的主要内容,最后在此基础
3、之上对该书作出简要评价。一、背景介绍二十世纪四十年代到五十年代末这段吋期可谓是计算语言学的萌芽期。虽然“计算语言学”这个术语概念还未被提出,但是有很多具备先见之明的研究者及学者们就开始从计算的角度来探讨语言现象,揭示语言所具有的数学性。二十世纪六十年代的屮期到八十年代末可以算作是计算语言学的主要发展期。在此期间,许多的相关学科在相互借鉴,互为补充的基础上取得了不少鼓舞人心的成果。在二十世纪九十年代的最后五年,计算语言学的研究变化显著,出现了空前繁荣的局面。这主要表现在以下三个方面:首先,概率与数据驱动方法成了计算语言学的标准方法。其次,由于计算机
4、速度与其存储量的增加,使得在计算语言学的某些领域,特别是语咅合成、语咅识别、文字识别、拼写检查、语法检查这些应用领域,有可能进行商品化的开发。第三,随着网络技术的发展,互联网逐渐变成一个多语言的网络世界,互联网上的机器翻译、信息检索和信息抽取的需要变得更加紧迫。正是在这样的背景下,国内计算语言学研究也展现出了新的生机活力,刘颖教授的这木《计算语言学》便是很好的说明。二、内容概述全书共分为十章,第一章为“计算语言学简介”。本章主要介绍了计算语言学的概念及其与计算机科学、语言学、数理语言学及自然语言的关系。此外,对计算语言学的主要研究内容作了详细的阐
5、述,并说明了计算语言学理论的主要用途,包括机器翻译、语咅口动识别和口动生成、口然语言理解及信息口动检索等。本章的第四部分介绍了计算语言学研究的基本方法,涉及理性主义与经验主义。最后,详细的梳理了计算语言学的发展历程,全面阐述了计算语言学以及在应用领域屮已经取得的研究成果。第二章“机器词典”部分主要介绍自然语言处理领域中常用的机器词典,包括《现代汉语语法信息词典》、《同义词词林》、Wordnet.Framenet及《知网》。其中,详细介绍了每部词典中所包含的内容、词与词形成的关系、词典Z间的相互联系与区别以及各种词典的独特应用。由此,通过不同词典的
6、相互对照,也可以清晰分辨出不同内容的词典及其在自然语言中的不同应用。第三章“词法分析”对以汉语为代表的分析型语言,以英语为代表的曲折型语言以及以F1语为代表的粘着型语言进行了词汇层面处理的相关介绍。其中,在汉语自动分词部分,木章对汉语中词与自动分词、自动分词的重要性、自动分词方法、汉语切分歧义及其处理等内容作了详细介绍。英语词法分析部分对词法分析方法、词法分析算法、为何要进行词法分析以及词法分析的程度问题作了具体说明。最后,对日语词语特征、日语分词的常用方法及切词与词性标注等进行了总结。尤其是在F1语切词与词性标注中,运用了邻接表分析法与配价分析
7、法对F1语词法进行了详细对比,总结分析。第四章为“词性标注”。本部分首先对词性标注的定义与研究进展进行了概述,并举例说明。之后,对词性标注集从规范、确定原则、适用范围及词类划分与标记代码四个角度作了系统阐述。重点介绍了词性标注的三种方法:规则方法,统计方法及基于转换的错误驱动学习方法。其中,对统计方法作了重点表述,其是基于1IMM的词性标注、基于条件随机场的词性标注与基于最大爛模型的词性标注。第五章为“形式语言理论与自动机”。主要介绍了形势语言理论,涉及形式语法及其组成、形式语法的定义及特点以及进行形式语法研究的必要性。在自动机理论部分,分析了进
8、行抽象分析处理的四种演算及机器:图灵机(turningmachine)、F推自动机(pushdownautomaton)^线性有界自动机
此文档下载收益归作者所有