(一)加载
加载阶段,虚拟机完成三件事:
- 通过一个类的全限定名来获取定义此类的二进制字节流;
- 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构;
- 在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口。
其中,获取字节流的方式:从Zip包中获取(jar,ear,war等);从网络中获取(Applet);运行时计算生成(动态代理技术);其他文件(JSP文件);数据库读取。
注意:数组类由Java虚拟机直接创建,本身不通过类加载器创建;但是,数组类的元素类型是通过类加载器创建。
(二)验证
1.作用:
验证是连接阶段的第一步,目的是确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。如果验证到输入的字节流不符合Class文件格式的约束,jvm就抛出java.lang.VerfyError异常或其子类异常。
2.验证阶段大致经历4个阶段的检验动作:
文件格式验证、元数据验证、字节码验证、符号引用验证。第一个基于二进制字节流;后面三个是基于方法区的存储结构。
(1) 文件格式验证
-作用:验证字节流是否符合Class文件格式的规范,并且能被当前版本的虚拟机处理。
-如:是否以魔数0xCAFEBABE开头;主次版本号是否在当前VM处理范围之内;
常量池的常量中是否有不被支持的常量类型(tag标志);
-目的:保证输入的字节流能正确地解析并存储于方法区之内,格式上符合一个Java类型的要求。
(2) 元数据验证
-作用:对字节码描述的信息进行语义分析,保证其描述的信息符合Java语言规范的要求。
-如:这个类是否有父类(处Object外,所有类都有父类);
这个类的父类是否继承了不允许被继承的类(final修饰的类);
如果这个类不是抽象类,是否实现了父类或接口的所有要实现的方法;
类中字段、方法是否与父类产生矛盾(覆盖父类final字段,方法重载不符合规则);
类中是否有父类、是否合法的继承类、是否实现了父类或接口的方法、字段和方法是否与父类产生矛盾
-目的:保证对类的元数据信息进行语义校验,保证不存在不符合Java语言规范的元数据信息。
(3) 字节码验证
-作用:对类的方法体进行校验分析,保证被校验类的方法在运行时不会做出危害VM安全的事件;
-如:保证任意时刻操作数栈的数据类型与指令代码序列都能配合工作;
保证跳转指令不会跳转到方法体以外的字节码指令上;
保证方法体中的类型转换是有效的;
方法体:类型转换是否有效、操作数栈和指令代码是否匹配工作、跳转指令是否跳转到正确位置
-目的:通过数据流和控制流分析,确定程序语义是合法、符合逻辑的
(4) 符号引用验证
-作用:发生在VM将符号引用转化为直接引用的时候,转化动作在连接的第三阶段——解析阶段
中发生。是对类自身以外的信息进行匹配性校验。
-如:符号引用中通过字符串描述的全限定名是否能找到对应的类;
在指定类中是否存在符合方法的字段描述符以及简单名称所描述的方法和字段;
符号引用中的类、字段、方法的访问性是否能被当前类访问。
-目的:确保解析动作能正常执行,如果无法通过符号引用验证,抛java.langIncompatibleClassChangeErrot异常的子类,如java.langIllegalAccessError、java.lang.NoSuchFieldError和java.lang.NoSuchMethodError等。
魔数:magic number是指每个Class文件的头4个字节;作用是确定这个文件是否为一个能被虚拟机接受的Class文件。
版本号:紧接着魔数的4个字节是存储Class文件的版本号,第5、6字节是次版本好,第7、8字节是主版本号。版本号从45开始。
Class文件结构:
|魔数 |次版本号 |主版本号| 常量池 |访问标志|
4字节 2 2 2
全限定名、简单名和描述符:
全限定名:如"com.ljy.TestClass"中改为"com/ljy/TestClass"
简单名:没有类型和参数修饰的方法或字段名称:如inc()的简单名是"inc"
描述符:描述字段的数据类型、方法的参数列表(数量、类型及顺序)和返回值。
如:"int[]"--->"[I" "void inc()"--->"()V" "java.lang.String[][]"--->"[[Ljava/lang/String;" 先参数列表,后返回值,每个数组用"[" "java.lang.String.toString()"--->"()Ljava/lang/String;"
(三)准备
作用:是正式为类变量分配内存并设置类变量初始值的阶段,这些变量所使用的内存都将在方法区中进行分配。
注意:
1.该阶段进行内存分配仅包括类变量(static修饰的),不包括实例变量,实例变量是在对象实例化随着对象一起分配在Java堆中。
2.初始值是数据类型的零值:例如public static int value = 123; 准备阶段:value=0; 初始化阶段:value=123;
特殊:如果是final修饰的,准备阶段就设定好初始化的值。
(四)解析
作用:VM将常量池内的符号引用替换为直接引用的过程。
符号引用和直接引用:
符号引用:
以一组符号来描述所引用的目标,符号可以是任何形式的字面量,与VM实现的内存布局无关,引用的目标并不一定已经加载到内存中。
直接引用:
可以是直接指向目标的指针、相对偏移量或是一个能间接定位到目标的句柄。直接引用于VM实现的内存布局相关,引用的目标必定已经在内存中存在。
解析的符号引用:类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符7类。分别对应于常量池的CONSTANT_Class_info、CONSTANT_Fieldref_info、CONSTANT_Methodref_info、CONSTANT_InterfaceMethodref_info、CONSTANT_MethodType_info、CONSTANT_MethodHandle_info和CONSTANT_InvokeDynamic_info7种常量类型。
(五)初始化
作用:类初始化阶段是类加载过程最后一步,开始执行类中定义的Java程序代码(字节码),是执行类构造器<clinit>()方法的过程。
<clinit>()方法:
1.<clinit>()是由编译器自动收集类中的所有类变量的赋值动作和静态语句块中的语句合并产生;
2.<clinit>()不需要显式地调用父类构造器,VM保证在调用<clinit>()之前就已经执行完父类的<clinit>(),所以VM中第一个被执行的<clinit>()的类肯定是java.lang.Object;
3.父类中定义的静态语句优先于子类的变量赋值操作;
4.<clinit>()对于类或接口并不是必须的,若一个类中没有静态语句块也没有对变量的赋值操作,编译器不会生成<clinit>()方法;
5.接口中不能使用静态语句块,但仍然有变量初始化赋值操作,所以接口会生成<clinit>()方法,但是,接口的<clinit>()不需要先执行父接口的<clinit>()且实现类初始化时不会执行接口的<clinit>()方法。
6.VM会保证一个类的<clinit>()方法在多线程环境中被正确地加锁、同步。
总结:
类加载过程分为:加载——验证——准备——解析——初始化
加载:又分为三个阶段:
(1)通过一个类的全限定名来获取定义此类的二进制字节流;
(2)将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构;
(3)在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口。
验证 :确保Class文件的字节流中包含的信息符合当前虚拟机的要求
分为:文件格式验证、元数据验证、字节码验证、符号引用验证
(1)文件格式验证:保证字节流是符合Class文件的规范,能被当前VM处理,从而保证字节流能够正确解析进入方法区;
(2)元数据验证:对元数据信息进行语义分析;
(3)字节码验证:对类的方法体进行校验,对数据流和控制流分析;
(4)符号引用验证:对类自身以外的信息进行匹配性校验,保证解析阶段能正常进行;
准备:正式为类变量分配内存并设定初始值(数据的零值),内存时在方法区中分配。(不是实例变量)
解析:将常量池内的符号引用替换为直接引用,主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符7类符号引用进行解析。
初始化:真正开始执行类的定义的Java程序代码(字节码),实际上是执行类的构造器<clinit>()方法的过程。(类变量的赋值以及静态语句块)