2文法和语言的形式定义

2文法和语言的形式定义

ID:24826178

大小:3.75 MB

页数:110页

时间:2018-11-15

2文法和语言的形式定义_第1页
2文法和语言的形式定义_第2页
2文法和语言的形式定义_第3页
2文法和语言的形式定义_第4页
2文法和语言的形式定义_第5页
资源描述:

《2文法和语言的形式定义》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、语言及其文法计算机科学系李静本章主要内容语言概述基本定义文法(Grammar)的定义CFG的分析树(ParseTree)文法的分类文法的构造语言概述什么是语言?语言概述语言特征自然语言(NaturalLanguage)是人与人的通讯工具环境、背景知识、语气、二义性鲁迅对《红楼梦》的评价单是命意,就因读者的眼光而有种种:经学家看见《易》,道学家看见淫,才子看见缠绵,革命家看见排满,流言家看见宫闱秘事。计算机语言(ComputerLanguage)计算机系统间、人机间通讯工具严格的语法(Grammar)、语义

2、(semantics)语言概述语言的描述方法——现状自然语言:自然、方便-不易形式化计算机语言:严格、准确-易于形式化形式化描述高度的抽象,严格的数学理论基础和方便的计算机表示语言概述自然语言——形式化的内容提取语言(Language):满足一定条件的句子集合句子(Sentence):满足一定规则的单词序列单词(Token):满足一定规则的字符(Character)串自然语言语言是字和组合字的规则例:第译始一天课今开编上节今天开始上第一节编译课语言概述字组合规则无规则使用不表达意义的串语言(表达意义的话)

3、语言概述程序设计语言——形式化的内容提取程序设计语言(ProgrammingLanguage):组成程序的所有语句的集合。程序(Program):满足语法规则的语句序列。语句(Sentence):满足语法规则的单词序列。单词(Token):满足词法规则的字符串。例:变量=表达式if条件then语句while条件do语句语言概述形式化语言理论用数学方法研究自然语言(如英语)和人工语言(如程序设计语言)的产生方式、一般性质和规则的理论。描述形式——文法语法——语句语句的组成规则描述方法:BNF范式、语法(描述

4、)图词法——单词单词的组成规则描述方法:BNF范式、正规式形式化语言语言学家Chomsky最初从产生语言的角度研究语言。1956年,通过抽象,他将语言形式地定义为是由一个字母表中的字母组成的一些串的集合。可以在字母表上按照一定的规则定义一个文法(Grammar),该文法所能产生的所有句子组成的集合就是该文法产生的语言。克林(Kleene)在1951年到1956年间,从识别语言的角度研究语言,给出了语言的另一种描述。克林是在研究神经细胞中,建立了自动机,他用这种自动机来识别语言:对于按照一定的规则构造的任一

5、个自动机,该自动机就定义了一个语言,这个语言由该自动机所能识别的所有句子组成。形式化语言1959年,Chomsky通过深入研究,将他本人的研究成果与克林的研究成果结合了起来,不仅确定了文法和自动机分别从生成和识别的角度去表达语言,而且证明了文法与自动机的等价性。20世纪50年代,人们用巴科斯范式(BackusNourForm或BackusNormalForm,简记为BNF)成功地对高级语言ALGOL-60进行了描述。实际上,巴科斯范式就是上下文无关文法(ContextFreeGrammar)的一种表示形式

6、。这一成功,使得形式语言在20世纪60年代得到了大力的发展。形式化语言形式语言与自动机理论除了在计算机科学领域中的直接应用外,更在计算学科人才的计算思维的培养中占有极其重要的地位。计算思维能力的培养,主要是由基础理论系列课程实现的,该系列主要由从数学分析开始到形式语言结束的一些数学和抽象程度比较高的内容的课程组成。它们构成的是一个梯级训练系统。在此系统中,连续数学、离散数学、计算模型等三部分内容要按阶段分开,三个阶段对应与本学科的学生在大学学习期间的思维方式和能力的变化与提高过程的三个步骤。计算思维能力的

7、培养过程高水平计算专业人才的计算思维能力的渐进培养!文法文法阐明语法的一种工具形式化语言理论的基本概念以有穷的集合刻画无穷的集合一个形式化例子<句子>→<主语><谓语><主语>→<名词>

8、<代词><谓语>→<动词><宾语><宾语>→<名词>

9、<代词><名词>→小张

10、小王

11、小李

12、学生

13、篮球<代词>→我

14、你

15、他<动词>→是

16、打直观地认识文法例子:我是学生基本定义字母表字母表(Alphabet)Σ是一个非空有穷集合,字母表中的元素称为该字母表的一个字母(Letter),也叫字符(Character)。例:以下是

17、不同的字母表:{a,b,c,d}{a,b,c,……,z}{0,1}ASCII字母表基本定义符号串的定义(1)ε是Σ上的一个符号串。(2)若x是Σ上的符号串,而a是Σ的元素,则xa是Σ上的符号串。(3)y是Σ上的符号串,当且仅当它由(1)和(2)导出。由字母表中的符号所组成的任何有穷序列被称之为该字母表上的符号串。基本定义符号串的长度:x=abcd,

18、x

19、=4空符号串:ε符号串的头尾:z=xy符号串的固有头:z=xy,y≠ε符号

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。