第一章:引论
1.1语言处理器
预处理器:源程序可能被分割成多个模块,并存放于多个文件中,预处理器将其聚合在一起
编译器:将源程序转换为汇编语言
汇编器:将汇编语言转换为可重定位的机器代码
链接器:代码文件间可能互相引用,链接器解决外部内存地址问题
加载器:把所有可执行文件放入内存执行
可重定位:即逻辑地址的重新修正,大型程序经常被分为多个部分进行编译,然后每部分被链接器链接一个程序
1.2 一个编译器的结构
分析部分:源程序->多个组成要素->语法结构->中间表示
综合部分:根据中间表示和符号表生成目标程序
1.2.1 词法分析:或称扫描。词法分析器读入字符流,组织成词素(lexeme)序列。每个词素为一个词法单元(token),形式为,即每个词素给一个名字,具体内容存储在符号表中,通过名字获取。
1.2.2 语法分析(syntax analysis):或称解析(parsing)。语法分析器使用词法单元的第一个分量来创建树形的中间形式,常用语法树。
1.2.3 语义分析(semantic analyzer):使用语法树和符号表中的信息检查源程序是否和语言定义一致。同时收集类型信息,并存放于语法树或符号表中以备后用。类型检查是重要部分
1.2.4 中间代码生成:语法分析和语义分析完成后,生成一个明确的低级或类机器语言的中间表示,可看做某种抽象机器的程序。
三地址代码的中间表示形式
1.2.5 代码优化:如整数转浮点数的运算在编译期被完成;只使用一次的变量被替换掉
1.2.6 代码生成:代码生成器将中间表示形式映射为目标语言,一般是机器代码;一个重要方面是合理分配寄存器以存放变量
1.2.7 符号表管理:记录源程序变量名及其存储分配、类型、作用域等信息;对于过程名字,还包括了参数数量和类型、每个参数的传递方法(传值还是引用)以及返回类型
1.2.8 将多个步骤组合成趟:有些精心设计的中间表示形式使得可以把特定语言的前端趟和特定目标机的后端趟结合;如此可以将不同语言的前端趟和特定机器的后端趟相结合,为不同源语言建立该目标机的编译器;类似的,可以把一个前段趟和不同的目标机后端趟结合,建立针对不同目标机的编译器。
1.2.9 编译器构造工具:语法分析器的生成器、扫描器的生成器、语法制导的翻译引擎、代码生成器的生成器、数据流分析引擎、编译器构造工具集