资源描述:
《编译原理语义分析和中间代码产生课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、语义分析和中间代码产生静态语义检查类型检查控制流检查一致性检查相关名字检查名字的作用域分析语法分析器中间代码产生器静态检查器中间代码优化器中间语言(复杂性界于源语言和目标语言之间)的好处:便于进行与机器无关的代码优化工作易于移植使编译程序的结构在逻辑上更为简单明确源语言程序目标语言程序中间语言程序CompilerFrontEndCompilerBackEnd常用的中间语言:后缀式,逆波兰表示三地址代码三元式四元式间接三元式DAG图表示7.1中间语言7.1.1后缀式后缀式表示法:Lukasiewicz发明的一种表示表达式
2、的方法,又称逆波兰表示法。一个表达式E的后缀形式可以如下定义:1.如果E是一个变量或常量,则E的后缀式是E自身。2.如果E是E1opE2形式的表达式,其中op是任何二元操作符,则E的后缀式为E1E2op,其中E1和E2分别为E1和E2的后缀式。3.如果E是(E1)形式的表达式,则E1的后缀式就是E的后缀式。逆波兰表示法不用括号。只要知道每个算符的目数,对于后缀式,不论从哪一端进行扫描,都能对它进行唯一分解。后缀式的计算用一个栈实现。一般的计算过程是:自左至右扫描后缀式,每碰到运算量就把它推进栈。每碰到k目运算符
3、就把它作用于栈顶的k个项,并用运算结果代替这k个项。把表达式翻译成后缀式的语义规则描述产生式E→E(1)opE(2)E→(E(1))E→id语义动作E.code:=E(1).code
4、
5、E(2).code
6、
7、opE.code:=E(1).codeE.code:=idE.code表示E后缀形式op表示任意二元操作符“
8、
9、”表示后缀形式的连接。数组POST存放后缀式:k为下标,初值为1上述语义动作可实现为:产生式程序段E→E(1)opE(2){POST[k]:=op;k:=k+1}E→(E(1)){}E→i{POST[k]
10、:=i;k:=k+1}例:输入串a+b+c的分析和翻译POST:123457.1.2图表示法图表示法DAG抽象语法树7.1.2图表示法无循环有向图(DirectedAcyclicGraph,简称DAG)对表达式中的每个子表达式,DAG中都有一个结点一个内部结点代表一个操作符,它的孩子代表操作数在一个DAG中代表公共子表达式的结点具有多个父结点a:=b*(-c)+b*(-c)的图表示法assigna+*buminuscDAGassigna+*buminusc抽象语法树*buminusc产生赋值语句抽象语法树的属性文法产生
11、式语义规则S→id:=ES.nptr:=mknode(‘assign’,mkleaf(id,id.place),E.nptr)E→E1+E2E.nptr:=mknode(‘+’,E1.nptr,E2.nptr)E→E1*E2E.nptr:=mknode(‘*’,E1.nptr,E2.nptr)E→-E1E.nptr:=mknode(‘uminus’,E1.nptr)E→(E1)E.nptr:=E1.nptrE→idE.nptr:=mkleaf(id,id.place)7.1.3三地址代码三地址代码x:=yopz表达式x
12、+yz翻译成的三地址语句序列是t1:=yzt2:=x+t1出于语句的右边只有一个算符的考虑三地址代码可以看成是抽象语法树或DAG的一种线性表示三地址代码是语法树或dag的一种线性表示a:=(b+cd)+cd语法树的代码dag的代码t1:=bt2:=cdt3:=t1+t2t4:=cdt5:=t3+t4a:=t5新增加的名字对应树/图中的内部结点assigna++bcdcduminus语法树三地址代码是语法树或dag的一种线性表示a:=(b+cd)+cd语法树的代码dag的代码t1:=bt2:=
13、cdt3:=t1+t2t4:=t3+t2a:=t4新增加的名字对应树/图中的内部结点assigna++bcduminus(b)dag三地址语句的种类本书常用的三地址语句赋值语句x:=yopz;x:=opy;x:=y无条件转移gotoL条件转移ifxrelopygotoL过程调用paramx和callp,n过程返回returny索引赋值x:=y[i]和x[i]:=y地址和指针赋值x:=&y,x:=y和x:=y生成三地址代码时,临时变量的名字对应抽象语法树的内部结点id:=E对表达式E求值并置于变量T中值id.pl
14、ace:=T从赋值语句生成三地址代码的S-属性文法非终结符号S有综合属性S.code,它代表赋值语句S的三地址代码。非终结符号E有如下两个属性:E.place表示存放E值的名字。E.code表示对E求值的三地址语句序列。函数newtemp的功能是,每次调用它时,将返回一个不同临时变量名字,如T1,T2,…。为赋值语句生成三地址代码