资源描述:
《一个简单语言的词法分析器.docx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、辽宁师范大学计算机与信息技术学院综合性实验报告课程名称:编译原理实验题目:一个简单语言的词法分析器学生姓名:专业:计算机科学与技术学号:实验日期:【实验目的】1.理解正规式和有限自动机的作用;进一步理解自动机理论。2.用状态图和状态矩阵表示有限自动机;3.以程序实现有限自动机的运行过程;4.掌握正规式转换成自动机的技术及有穷自动机实现的方法。【实验内容】利用正规表达式和自动机手段,设计各类单词的自动机表示及组合自动机表示,生成并调试程序,实现词法分析。【实验要求】1.待分析的简单的词法(1)关键字
2、:beginifthenwhiledoend所有的关键字都是小写。(2)运算符和界符:=+-*/<<=<>>>==;()#(3)其他单词是标识符(ID)和整型常数(SUM),通过以下正规式定义:ID=letter(letter
3、digit)*NUM=digitdigit*(4)空格有空白、制表符和换行符组成。空格一般用来分隔ID、SUM、运算符、界符和关键字,词法分析阶段通常被忽略。2.各种单词符号对应的种别码:3.词法分析程序的功能:输入:所给文法的源程序字符串。输出:二元组(syn,token
4、或sum)构成的序列。其中:syn为单词种别码;token为存放的单词自身字符串;sum为整型常数。例:对源程序beginx:=9;ifx>9thenx:=2*x+1/3;end#的源文件,经过词法分析后输出如下序列:(1,begin)(10,x)(18,:=)(11,9)(26,:)(2,if)(10,x)(23,>)(11,9)(3,then)(10,x)(18,:=)(11,2)(15,*)(10,x)(13,+)(11,1)(16,/)(11,3)(26,;)(6,end)(0,#)……【
5、实验过程】程序思路:首先定义关键字数组,把题目设置的关键字存入;读入源程序,对其进行词法分析;从input串中一个字符一个字符的赋值给ch,并对其进行分析:当为空格符时跳过;为字母时将其存入token数组;继续判断它的下一个字符,若为字符或数字则存入token数组,直至出现空格符;当为数字时,存入token数组,并判断其下一字符;当为字符“+”、“-”、“/”、“;”、“(”、“)”、“#”时,则直接对应的种别码;然而当碰到字符“:”“<”“>”时,则需要判断它的下一字符是否为“=”“>”,因为有
6、可能是“:=”“<>”“<=”“>=”。程序代码如下:#include#include#includechar*keyword[6]={"begin","if","then","while","do","end"};//关键字charinput[80];//输入串chartoken[8];//单词自身字符串charch;intsyn;//单词种别码intsum=0;//整型常数intp;//input下标intm=0;//token下标
7、intn,i;voidautomata(){//自动机for(i=0;i<8;i++)token[i]=NULL;ch=input[p++];while(ch=='')ch=input[p++];//跳过空格//标识符:字母或以字母开头和数字组成的ID=letter(letter
8、digit)*if((ch>='a'&&ch<='z')
9、
10、(ch>='A'&&ch<='Z')){m=0;while((ch>='0'&&ch<='9')
11、
12、(ch>='a'&&ch<='z')
13、
14、(ch>='A'&&
15、ch<='Z')){token[m++]=ch;ch=input[p++];//识别出一个标识符}token[m++]=' ';p--;//回退一位syn=10;//单纯的标识符(自定义的)for(i=0;i<6;i++)//将识别出来的字符和关键字做比较if(strcmp(token,keyword[i])==0){syn=i+1;//关键字种别码break;}}//数字NUM=digitdigit*elseif(ch>='0'&&ch<='9'){sum=0;while(ch>='0'&&c
16、h<='9'){sum=sum*10+ch-'0';ch=input[p++];//读取下一个字符}p--;//回退一下syn=11;//11标识数值类型}//符号elseswitch(ch){//其他字符case'#':syn=0;token[0]=ch;break;case'+':syn=13;token[0]=ch;break;case'-':syn=14;token[0]=ch;break;case'*':syn=15;token[0]=ch;break;case'/':s