前言
生成抽象语法树之后,下一步要做的就是对其进行分析,这个过程就称为语义分析,在此步骤我们需要做的有
- 变量引用的消解
- 类型名称的消解
- 类型定义检查
- 表达式的有效性检查
- 静态类型检查
以上的五个过程的执行顺序有着一定的限制.就是类型名称的消解是类型定义检查的前提,而表达式的有效性检查在前三个过程结束前是不能执行的,介于它们执行顺序的关系,可以由下图表示
变量引用的消解
变量引用的消解是指将所有变量和它们的定义关联起来,例如变量a
可能是全局变量a
,也可能是静态变量a
,还可能是局部变量a
,为了消除这种不确定性,我们对它们进行和定义的关联.
具体操作就是给变量节点对象增加变量定义的属性.
类型名称的消解
在有的语言中,类型名称TypeRef
和类型实体Type
是分开处理的,原因是TypeRef
可以理解为类型的声明,Type
则是类型的实现,我们有可能在实现之前就使用了这种类型.所以才会区分处理.
这里的消解,是将TypeRef
和Type
进行关联.通过一个TypeTable
的对象去管理它们的对应关系.
类型定义的检查
类型定义的检查是检查在定义类型时使用了不符合逻辑的定义声明,比如
- 包含 void 的数组、结构体、联合体
- 成员重复的结构、联合体
- 循环定义的结构体、联合体
1和2的实现非常简单,这里就不赘述了,3可以这样来理解,结构体或者联合体对其他类型是引用可以看做是一个有向使用,相互之前的关系可以做成一个图
如果存在闭环,则存在循环定义.
检测有向图中的闭环的算法
要检测有向图是否存在闭环,可以使用如下算法.
- 选择任意一个节点并标注为
查找中
- 沿着边依次访问所有与该节点相邻的节点
- 如果访问到的节点没有标注任何状态,则将节点标注为
查找中
;如果标注了``查找结束,则不做任何处理,返回之前的节点;如果标注为
查找中`,则说明存在闭环. - 从当前的节点重复步骤2和3,如果已经没有可访问的相邻节点,则将该节点标注为
查找结束
,并沿原路返回. - 按照上述流程对所有节点进行处理,如果没有遇到
查找中
状态的节点,就说明不存在闭环.
表达式有效性检测
表达式需要检测的问题有
为无法赋值的表达式赋值(例:1 = 2 + 2)
使用非法的函数名调用函数(例:"string"("%d\n", i))
操作数非法的数组引用(例:1[0])
操作数非法的成员引用(例:1.memb)
操作数非法的指针间接引用(例:1->memb)
对非指针的对象取值(例:*1)
对非左值的表达式取地址
静态类型检查
语言的操作都对操作数的类型有所限制.例如结构体之间无法用 + 进行 加法运算,指针和数值之间无法用 * 进行乘法运算,将数组传递给参数类型为 int 型的函数会出现莫名其妙的结果.
对允许的操作数类型进行限制,例如 * 操作只适用于类型相同的数值之间,在编译过程中检查是否符合这样的限制的处理就是静态类型检查(static type checking).
静态类型检测的隐式类型转换
二元运算 * 只允许在相同类型的整数之间进行,但是如果在不同类型的数值之间进 行 * 运算,为了能够正常运算,编译器会自动对操作数的类型进行转换.这样的转换就称为隐式类型转换(implicit conversion).
例如,当int类型的值和long类型的值进行乘法运算时, 编译器会将两个操作数统一为 long 类型.
另外,在一些不得不强行转换为特定类型的情况下也会发生隐式类型转换.
例如,当 return 返回值的类型和函数返回值的类型不一致时,必须转换为函数返回值的类型
赋值运算时必须转换为和左值一致的类型等。显式声明的函数返回值或变量类型无法轻易改变,因此 只能利用隐式转换来改变值的类型。
在静态类型检查过程中也会实施隐式类型转换