虚拟机把Class文件(描述类的数据)加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是类加载机制。
Java中,类显性的加载、连接、初始化都是在 运行期 完成。
Class文件是一串二进制的字节流。
1、类加载总体流程图
类的整个生命周期分为以上七个阶段:加载、验证、准备、解析、初始化、使用、卸载。
类加载的全过程包括5个阶段:加载、验证、准备、解析、初始化。
2、虚拟机规范规定了如下几种情况就必须要进行初始化
遇到new、getstatic、putstatic、invokestatic指令时,对应到程序中就是使用到new实例化对象时、读取或设置类静态字段时(非final)、调用静态方法时。需要进行初始化。
使用java.lang.reflect包的方法对类进行反射调用时,需要进行初始化。
使用一个类时,若其父类还未初始化,则需先初始化其父类。
虚拟机启动时,包含main方法的类(主类),虚拟机会将其初始化。
java.lang.invoke.MethodHandle实例最后的解析结果REF_getStatic、REF_putStatic、REF_invokeStatic方法句柄,并且这个方法句柄对应的类没有进行初始化,则需要先进行初始化。
以上五种情况称为主动使用,其他的情况均称为被动使用,被动使用不会导致初始化。
3、类加载的全过程
类加载的全过程包括5个阶段:加载、验证、准备、解析、初始化。
3.1 加载
加载阶段虚拟机需要完成如下事情:
通过类的全限定名来获取此类的二进制字节流。
将二进制字节流所代表的静态存储结构转化为方法区的运行时数据结构。
在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口。
对于 数组 类而言,数组类由java虚拟机直接创建,不通过类加载器创建。数组类的创建过程如下:
如果数组元素类型是引用类型,就采用双亲委派模型进行加载(之后会介绍),数组类将在加载该元素类型的类名称空间上被标识。
如果数组元素类型为基本类型,数组类被标记为与引导类加载器关联。
数组类的可见性与其元素类型可见性一致,如果元素类型不是引用类型,那数组类的可见性默认为public。
创建的Class对象存放在方法区中。对象绝大多数放在堆中,Class对象是一个例外。
3.2 验证
此阶段是确保class文件的字节流包含的信息符合虚拟机的要求。主要会进行如下的验证。
- 文件格式验证
验证字节流是否符合Class文件格式规范。如是否以魔数开头、主次版本号是否能被虚拟机处理、常量池的常量中是否有不被支持的常量类型等等。
- 元数据验证
对字节码描述的信息进行语义分析。如这个类是否有父类、这个类是否继承了不允许被继承的类、非抽象类是否实现了父类或接口中要求实现的所有方法等等。
- 字节码验证
分析数据流和控制流,确定程序语义是否合法,符合逻辑。如任意时刻操作数栈的数据类型与指令代码序列都能配合工作、保证跳转指令不会跳转到方法体以外的字节码指令上等等。
- 符号引用验证
符号引用转化为直接引用的时候进行验证。如符号引用中通过字符串描述的全限定名是否能够找到对应的类、指定类中是否存在符合方法的字段描述符以及简单名称所描述的方法和字段等等。
3.3 准备
为类变量(被static修饰的变量)分配内存并为类变量设置系统初始值的阶段,这些类变量所使用的内存都将在方法区进行分配。静态字段(非final)会被赋予系统默认值,而对于常量字段(final、static),在准备阶段直接赋予用户设定的值。
3.4 解析
将 常量池 中的 符号引用 替换为 直接引用 的过程。
符号引用:符号引用以一组无歧义的符号来描述所引用的目标。符号引用与虚拟机的内存布局无关,引用的目标并不一定已经加载到内存中。
直接引用:直接引用可以是直接指向目标的指针、相对偏移量或是一个能够间接定位到目标的句柄。直接引用和虚拟机实现的内存布局有关,引用的目标必须已经存在于内存中。
解析动作主要是针对7中常量类型:
CONSTANT_Class_info
CONSTANT_Fieldref_info
CONSTANT_Methodref_info
CONSTANT_InterfaceMethodref_info
CONSTANT_MethodType_info
CONSTANT_MethodHandle_info
CONSTANT_InvokeDynamic_info
3.5 初始化
在此阶段,才开始真正执行用户自定的java代码。在准备阶段,类变量已经被赋予了系统默认值,而在初始化阶段,会赋予用户自定义的值。
初始化阶段就是执行类构造器 <clinit>() 方法的过程。
<clinit>() 方法
由编译器收集类中的所有类变量的赋值动作(如果仅仅只是声明,不会被收集)和静态语句块中的语句合并产生的,收集顺序按照语句在源文件中出现的顺序所决定;在静态语句块中只能访问定义在静态语句之前的变量;而对于定义在静态语句块之后的变量,在前面的静态语句块可以对它进行赋值,但是不能够访问。
不需要显示调用父类构造器。虚拟机会保证在子类的<clinit>()方法执行之前,父类的<clinit>()方法已经执行完毕,所以,第一个被执行的<clinit>()方法的类肯定是java.lang.Object。
父类中定义的静态语句块优先于子类的静态语句。
<clinit>()方法对类和接口都不是必须的,若类中没有静态语句块和静态变量赋值操作,则不会生成<clinit>()方法。
接口中不能使用静态语句块,但任然有变量初始化的赋值操作,因此接口也会生成<clinit>()方法。不同的是,执行接口的<clinit>()方法不需要先执行父接口的<clinit>()方法,只有在使用了父接口的变量时,父接口才会进行初始化。接口的实现类在初始化时也不会执行接口的<clinit>()方法。
虚拟机会保证<clinit>()方法在多线程环境中会被正确的加锁、同步。