编译器可以编译一个程序,但是编译器本身也是一个程序,它是由更早的编译器编译而成 的,那么,最早的编译器是谁呢?
Apple的编译器是clang-LLVM架构。LLVM(Low Level Virtual Machine)是一个虚拟机,是编译器的后端;clang(C Language Family Frontend For LLVM)是C语言系列的为LLVM设计的编译器前端。
Apple编译器的三层架构:source(源文件) ->{ frontend(clang) -> optimizer(优化器) -> backend(LLVM) } -> machine code(机器码)
所有C系的语言(C、C++、Objective-C)的编译器前端都是clang,swift的编译器前端是swift。
clang在概念上是编译器的前端,同时,在命令行中,他是一个“黑盒”的Driver(驱动)。它封装了编译管线、前端命令、LLVM命令、Toolchain命令等,也就是说编译器一步一步做什么都是由clang来安排的。
点击Run之后,编译器进行的操作:(1)Preprocess ,处理“#”打头的预处理指令。(2)Lexical Analysis,词法分析,即把原生代码拆分揉碎,生成Tokens。(3)Semantic Analysis,语法分析。验证语法是否正确,如错误会有提示;并且根据当前语言的语法,生成语义节点,并将所有节点组合成抽象语法树(Abstract Semantic Tree,AST)。(4)CodeGen IR代码生成。CodeGen负责将语法树从顶至下遍历,翻译成LLVM IR,LLVM IR是frontend的输出,也是backend的输入,它是前后端的桥接语言。(5)Optimize,优化。(6)LLVM BitCode生成字节码。(7)link生成Executable。
我们能用clang做什么比较有意思的事儿?(1)LibClang,C的API来访问clang的上层能力,如获取tokens、遍历语法树、代码补全、获取诊断信息。可以使用Objective-C的开源库ClangKit。eg:检查属性名字的拼写是否正确,如不正确给出拼写建议。(2)LibTooling,eg:写Objective-C转swift的转换器(3)ClangPlugin,可以作为插件注入到编译流程中,可以影响build和决定编译过程。eg:在大公司整顿代码风格的时候,可以使用plugin在不规范的地方报warning。
Clang LLVM的相关资料:(1)http://clang.llvm.org/docs/index.html (2) http://blog.llvm.org/ (3) https://www.objc.io/issues/6-build-tools/compiler/ (4) http://llvm.org/docs/tutorial/index.html (5) https://github.com/loarabia/Clang-tutarial