资源描述:
《编译原理课程设计.docx》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、编译原理课程设计实验名称:C-语言词法分析器的手工构造C-语言词法分析器的lex生成C-语言语法分析器的手工构造学生姓名:刘恺丽学生学号:指导教师姓名:于中华实验一:C-语言词法分析器的手工构造一、实验目的及意义1.理解C-语言的词法特点,并能构造各种token的正则表达式;2.掌握将正则表达式转换为DFA的方法;3.学会设计C-语言手动生成词法分析器的数据类型和数据结构。二、实验环境1.操作系统:WindowXP/Windows7;2.开发环境:MicrosoftVisualC++6.0。三、算法分析与设计1.C-语言的词法规则(1)关键字
2、elseifintreturnvoidwhile(2)特殊符号+-*/<<=>>===!==;,()[]{}/**/(3)其它token(区分大小写)ID=letterletter*NUM=digitdigit*letter=a
3、…
4、z
5、A
6、...
7、ZDigit=0
8、…
9、9(4)空白符号空白t(5)注释由标记符号/*…*/标记起来的部分。2.C-语言的词法正则表达式digit[0-9]number{digit}+letter[a-zA-Z]identifier{letter}+newlinewhitespace[""t]+3.C-
10、语言的DFA4.重要数据类型设计(1)token类型用枚举量分为以下几个typedefenum{ENDFILE,ERROR,ELSE,IF,INT,RETURN,VOID,WHILE,ID,NUM,PLUS,MINUS,TIMES,OVER,LT,LTE,RT,RTE,EQ,NE,ASSIGN,SEMI,COMMA,LPAREN,RPAREN,LZ,RZ,LD,RD,LC,RC}TokenType;(2)DFA9个状态typedefenum{START,INNE,INEQ,INLT,INRT,INID,INNUM,INOVER,INCOMME
11、NT1,INCOMMENT2,DONE}StateType;四、代码实现1.查找保留字函数TokenTypeSFindResvd(char*s)须注意:对Keyword先将keyWord归为ID类。getToken时再匹配。保留字数据结构如下:staticstruct{char*str;TokenTypetok;}reservedWords[MAXRESERVED]={{"else",ELSE},{"if",IF},{"int",INT},{"return",RETURN},{"void",VOID},{"while",WHILE}};sta
12、ticTokenTypereservedLookup(char*s){inti;for(i=0;i13、长。3)实现DFA的核心代码及分析:扫描程序的主函数为getToken,用的是嵌套case的方法,通过自定义一个状态枚举类型来标记当前所处的DFA状态,并用字符数组tokenString来保存已经扫描过的字符,每次调用getToken函数的时候,当前状态都会被初始化为START状态,用while循环当当前状态不为DONE状态,就从输入流获取一个字符,并根据上面给出的DFA判断如何进行状态转移;当当前状态为接收状态时,tokenString里面就是一个完整的token,于是将tokenString的内容打印到listing文件并返回tokenS
14、tring里面的内容。getToken函数调用getNextChar函数获取源文件中下一个字符,如果某些状态需要回溯一个字符,则调用ungetNextChar函数将已经获取的字符释放出来等待下一个状态中重新获取。GetToken函数中识别token关键代码:TokenTypegetToken(void){inttokenStringIndex=0;TokenTypecurrentToken;StateTypestate=START;intsave;while(state!=DONE){intc=getNextChar();save=true;
15、switch(state){caseSTART:if(isdigit(c)){state=INNUM;}elseif(isalpha(c))state=INID;e