虽然在不同目标平台上的JVM实现不一样,但是有3种Java Compiler是极具代表性的:
- 前端编译器: 如我们经常使用的javac. 在编译时将全部的java源码文件转变成class文件,再放入目标机器执行
- JIT编译器:Android Dalvik / Android ART. 在运行时期将字节码转变成机器码
- AOT Compiler: (Ahead of Time Compiler) 在编译时就将java文件编译成目标平台上的机器码
前端编译器
从传统的javac来看,编译过程大致分为3个阶段:
- 解析与填充符号表过程
- 注解处理器的注解处理过程
- 分析与字节码生成过程
解析与填充符号表过程
- 词法与语法分析: 将源代码中的字符流构造成抽象语法树的过程。抽象语法树是一种用来描述程序代码语法结构的树形表示方法。
- 填充符号表: 符号表是一组符号地址和符号信息构成的表格。
注解处理器处理
我们平时使用的Java注解,本质就是用来对语法树做出修改,处理器的任务便是在编译是识别出这些注解同时修改抽象语法树。
语义分析与字节码生成
- 标注检查:语义分析的第一个步骤,用来检查包括诸如使用的变量是否已经声明、变量与赋值之间的数据类型是否能够匹配。其中有一个重要的步骤就是常量折叠
如:int a = 3 + 2, javap查看生成的class字节码,iconst指令向操作数栈中压入的是常量值5,这样在运行时期就不会CPU的运算量重新计算。 - 数据及控制流分析
用于检查诸如局部变量在使用前是否已经赋值,方法的每条路径上是否都有返回值,受查异常是否都被正常处理等问题。 - 解语法糖(desugar)
Java中我们经常使用的语法糖有泛型、自动装箱/拆箱、遍历循环、条件编译等.. 由于这些语法在运行时无法被识别,因此需要在编译阶段就将他们还原回简单的基础语法结构。
泛型
泛型的本质是参数化类型的应用,参数类型可以用在类、接口和方法的创建中,分别称为泛型类、泛型接口和泛型方法。
在Java中,泛型只在源码中存在,一旦经常编译,就会替换成原来的原生类型并且在相应的地方加上了强制类型转换代码。这一过程也叫做类型擦除
自动装箱/拆箱
基本类型自动装箱成包装类型,包装类型拆箱成基本类型,大多数Java程序员都已经了解。只是使用上有些地方需要注意,比方包装类型在使用“==”进行比较时,只有遇到算术运算时才会自动拆箱。
遍历循环
诸如 for(int i : list) {} 这样的loop循环在编译后都会转换成对数据结构iterator的调用
条件编译
对于if和常量搭配使用,在编译器发现不会执行到的语句块,将不会出现在编译之后的class文件当中 - 生成字节码class文件
在Compiler生成class文件时,不仅仅将前面步骤生成的信息转化成字节码,还会进行少量的代码添加和转换工作,如<init>和<clinit>就是在该阶段添加进class文件当中,如果Compiler发现代码中没有任何构造器,那么将会添加一个无参数的、访问性与当前类一致的构造器(也即经常所说的默认无参构造器)
JIT
在了解早期编译优化时已经学习了传统的前端编译器。那么对商用JVM来说,还有一种极其重要的编译器,这便是JIT Compiler(Just In Time Compiler)。我们知道,Java程序都是通过解释器(interpreter)进行解释执行的,而一些频繁运行的程序代码便会被认为热点代码(Hot Spot Code)。JIT的任务便是将这些热点代码编译成目标平台的机器码,并进行各种层次的优化。
JIT虽然能够加快JVM的执行效率,但是却同内存资源有着更高的要求,解释器可以节约内存,在一些资源受限的机器运行JVM时解释器更受青睐。不过现在已经很少见到没有JIT的虚拟机了,更多的是两种配合使用,甚至是三种Compiler一起使用。如Android在5.0 以前使用的Dalvik 虚拟机就使用的是Interpreter + JIT,5.0 ~ 7.0 之间使用的ART 是Interpreter + AOT的组合,而在最新的7.0之后的ART上使用的是Interpreter + JIT + AOT的组合。