资源描述:
《C语言词法分析器和C语言语法分析器编译原理课程设计.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、《编译原理课程设计》课程报告题目C语言词法分析器和C-语言语法分析器学生姓名学生学号指导教师提交报告时间2019年6月8日C语言词法分析器1实验目的及意义1.熟悉C语言词法2.掌握构造DFA的过程3.掌握利用DFA实现C语言的词法分析器4.理解编译器词法分析的工作原理2词法特点及正则表达式2.1词法特点2.1.1保留字AUTO,BREAK,CASE,CHAR,CONST,CONTINUE,DEFAULT,DO,DOUBLE,ELSE,ENUM,EXTERN,FLOAT,FOR,GOTO,IF,INT,LONG,REGISTER,RETURN,S
2、HORT,SIGNED,SIZEOF,STATIC,STRUCT,SWITCH,TYPEDEF,UNION,UNSIGNED,VOID,VOLATILE,WHILE,2.1.2符号+-*/++--+=-=*=<<=>>===!==;,()[]{}/**/:2.2正则表达式whitespace=(newline
3、blank
4、tab
5、comment)+digit=0
6、..
7、9nat=digit+signedNat=(+
8、-)?natNUM=signedNat(“.”nat)?letter=a
9、..
10、z
11、A
12、..
13、ZID=letter(letter
14、
15、digit
16、“_”)+CHAR='other+'STRING=“other+”3Token定义3.1token类型保留字autobreakcasecharconstcontinuedefaultdodoubleelseenumexternfloatforgotoifintlongredisterreturnshortsignedsizeofstaticstructswitchtypedefunionunsignedvoidvolatilewhile特殊符号+-*/++--+=-=*=<<=>>===!==;,()[]{}/**/:文件结束、错误
17、EOFERROR其它tokenNUMIDCHARACTERSTRINGtypedefenum{//错误、结束ENDFILE,ERROR,//保留字AUTO,BREAK,CASE,CHAR,CONST,CONTINUE,DEFAULT,DO,DOUBLE,ELSE,ENUM,EXTERN,FLOAT,FOR,GOTO,IF,INT,LONG,REGISTER,RETURN,SHORT,SIGNED,SIZEOF,STATIC,STRUCT,SWITCH,TYPEDEF,UNION,UNSIGNED,VOID,VOLATILE,WHILE,//其他
18、tokenID,NUM,CHARACTER,STRING,//特殊符号//+、-、*、/、++、--、+=、-=、*=、<、<=、>、>=、==、!=、=、;、,、(、)、[、]、//{、}、/*、*/、:PLUS,MINUS,TIMES,OVER,SELFPLUS,SELFMINUS,PLUSASSIGN,MINUSASSIGN,TIMESASSIGN,LT,LEQ,GT,GEQ,EQ,NEQ,ASSIGN,SEMI,COMMA,LPAREN,MINUSASSIGN,TIMESASSIGN,LT,LEQ,GT,GEQ,EQ,NEQ,ASSIG
19、N,SEMI,COMMA,LPAREN,RPAREN,LBRACKET,RBRACKET,LCBRACKET,RCBRACKET,LCOMMENT,RCOMMENT,COLON}TokenType;3.2tokenType类型代码4DFA设计4.1注释的DFA设计注释的DFA如下所示,一共分为5个状态,在开始状态1时,如果输入的字符为/,则进入状态2,此时有可能进入注释状态,如果在状态2时,输入的字符为*,则进入注释状态,状态将转到3,如果在状态3时,输入的字符为*,则有可能结束注释状态,此时状态将转到状态4,如果在状态4时输入的字符为/,则注
20、释状态结束,状态转移到结束状态。4.2词法分析的DFA设计词法分析的DFA如下所示,一共分为10个状态:START、INNUM、INNUM1、INNUM2、INID、INCOMPARE、INOPERATE、INSTRING、INCHAR、DONE。状态START表示开始状态,状态INNUM,INNUM1,INNUM2表示数字类型(NUM)Token的状态,状态INID表示标示符(ID)类型Token的状态,状态INOPERATE表示算数运算符型Token的状态,状态INOCOMPARE表示比较运算符型Token的状态,INSTRING表示字符串
21、(STRING)类型Token的状态,INCHAR表示字符(CHARACTER)类型Token的状态,状态DONE表示接收状态。l在开始状态START