1 内存结构概述
在上一章节中,我们了解了JVM的整体结构,现在我们更详细的了解它的结构
2、类加载子系统
2.1 类加载器子系统的作用
-
类加载器子系统负责从文件系统或者网络中加载Class文件
,class文件在文件开头有特定的文件标识。 - ClassLoader只负责class文件的加载,至于它是否可以运行,则由Execution Engine决定。
-
加载的类信息存放于一块称为方法区的内存空间
。除了类的信息外,方法区中还会存放运行时常量池信息,可能还包括字符串字面量和数字常量(这部分常量信息是Class文件中常量池部分的内存映射)
2.2 类加载器ClassLoader角色
- class file存在于本地硬盘上,可以理解为设计师画在纸上的模板,而最终这个模板在执行的时候是要加载到JVM当中来根据这个文件实例化出n个一模一样的实例。
- class file加载到JVM中,被称为
DNA元数据模板
,放在方法区
。 - 在
.class文件
–> JVM –> 最终成为元数据模板,此过程就要一个运输工具(类装载器Class Loader),扮演一个快递员的角色。
2.3 类的加载过程
public class HelloLoader {
public static void main(String[] args) {
System.out.println("hi classloader");
}
}
它的加载过程是怎么样的呢?
- 执行 main( ) 方法(静态方法)就需要先加载承载类 HelloLoader
- 加载成功,则进行链接、初始化等操作,完成后调用 HelloLoader 类中的静态方法 main
- 加载失败则抛出异常
完整的流程图如下所示:加载 --> 链接(验证 --> 准备 --> 解析) --> 初始化
2.3.1 加载Loading
1、通过一个类的全限定名获取定义此类的二进制字节流
2、将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
3、在内存中(方法区)生成一个代表这个类的java.lang.Class对象
,作为方法区这个类的各种数据的访问入口
补充:加载class文件的方式
- 从本地系统中直接加载
- 通过网络获取,典型场景:Web Applet
- 从zip压缩包中读取,成为日后jar、war格式的基础
- 运行时计算生成,使用最多的是:动态代理技术
- 由其他文件生成,典型场景:JSP应用
- 从专有数据库中提取.class文件,比较少见
- 从加密文件中获取,典型的防Class文件被反编译的保护措施
2.3.2 链接Linking
验证(Verify)
目的在子确保Class文件的字节流中包含信息符合当前虚拟机要求,保证被加载类的正确性
,不会危害虚拟机自身安全。
主要包括四种验证,文件格式验证,元数据验证,字节码验证,符号引用验证。
比如用来判断文件类型的魔数
准备(Prepare)
为类变量(静态变量)分配内存并且设置该类变量的默认初始值
,即零值。
class demo{
private static int i =5; // 在Prepare阶段 i=0 --> 在initialization阶段i=5
final static int j = 6; // 被final修饰的在Prepare阶段 j = 6
}
这里不包含用final修饰的static,因为final在编译的时候就会分配了,准备阶段会显式初始化
;
这里不会为实例变量分配初始化,类变量会分配在方法区中
,而实例变量是会随着对象一起分配到Java堆中
。
解析(Resolve)
将常量池内的符号引用转换为直接引用的过程
。
事实上,解析操作往往会伴随着JVM在执行完初始化之后再执行。
符号引用就是一组符号来描述所引用的目标。符号引用的字面量形式明确定义在《java虚拟机规范》的Class文件格式中。直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。
解析动作主要针对类或接口、字段、类方法、接口方法、方法类型等。对应常量池中的CONSTANT_Class_info,CONSTANT_Fieldref_info、CONSTANT_Methodref_info等。
2.3.3 初始化阶段
- 初始化阶段就是执行类构造器方法
<clinit>()
的过程。 - 此方法不需定义,是
javac编译器
自动收集类中的所有类变量的赋值动作和静态代码块中的语句合并而来。也就是说,当我们代码中包含static变量的时候,就会有<clinit>()
方法;如果当前类不存在static变量,那么它的字节码文件是不会存在<clinit>()
- 构造器方法中指令按语句在源文件中出现的顺序执行。
-
<clinit>()
不同于类的构造器。clinit是自带的,不是我们定义的(关联:构造器是虚拟机视角下的<init>()
) - 若该类具有父类,JVM会保证子类的
<clinit>()
执行前,父类的<clinit>()
已经执行完毕。 - 虚拟机必须保证一个类的
<clinit>()
方法在多线程下被同步加锁。
当我们代码中包含static变量的时候,就会有<clinit>()方法
public class AppTest {
private static int num =1;
static {
num = 2;
}
public static void main(String[] args) {
System.out.println(AppTest.num);
}
}
查看字节码
可以看出clinit主要就是把静态变量的初始化和静态代码块合并到一起的这样一个方法。先把1附给静态变量,然后再把2赋值给静态变量。
当我们代码中没有static变量的时候,就没有<clinit>()方法
public class AppTest {
private int a = 2;
public static void main(String[] args) {
int b = 3;
}
}
构造器方法中指令按语句在源文件中出现的顺序执行。
再看一个例子,在刚才的例子中再添加一个静态变量
public class AppTest {
private static int num =1;
static {
num = 2;
number = 20;
}
private static int number = 10;
public static void main(String[] args) {
System.out.println(AppTest.num);
System.out.println(AppTest.number);
}
}
这里的输出结果为:
2
10
这里的num我们上面解释过了,现在可以看这个number是如何赋值的,在Linking的prepare阶段静态变量num和number都被实例化为0,然后在initialization阶段,进行静态变量的初始化时,先执行number=20,然后执行number=10的操作,是按照源文件的顺序执行的
,所以最终结果为10。
构造器是虚拟机视角下的<init>()
public class AppTest {
private int a = 1;
private static int c = 3;
public AppTest(){
a = 10;
int d = 20;
}
public static void main(String[] args) {
int b = 2;
}
}
可以看到在init方法中执行的其实就是代码中构造器的部分,
所以说构造器就是虚拟机视角下的<init>()
,因为每个类都会有一个默认为空的构造器,所以在虚拟机中这个init方法是肯定存在的,而不像<clinit>()
若该类具有父类,JVM会保证子类的<clinit>()执行前,父类的<clinit>()已经执行完毕
public class AppTest {
static class Father{
public static int A = 1;
static {
A = 2;
}
}
static class Son extends Father{
public static int B = A;
}
public static void main(String[] args) {
System.out.println(Son.B); // 2
}
}
在Son的clinit执行之前,Father的clinit已经执行完毕,所以A=2,B=A,则B=2\
虚拟机必须保证一个类的<clinit>()方法在多线程下被同步加锁
public class AppTest {
public static void main(String[] args) {
Runnable r = () -> {
System.out.println(Thread.currentThread().getName() + "开始");
DeadThread deadThread = new DeadThread();
System.out.println(Thread.currentThread().getName() + "结束");
};
Thread t1 = new Thread(r,"t1");
Thread t2 = new Thread(r,"t2");
t1.start();
t2.start();
}
}
class DeadThread{
static {
if(true){
System.out.println(Thread.currentThread().getName() + "初始化当前类");
while(true){
}
}
}
}
程序处于卡死状态,由于DeadThread是一个static静态代码块,所以它是在
<clinit>()
方法中的,且这个静态代码块是个死循环,此时两个线程同时初始化DeadThread时, 只输出了一个 “初始化当前类”,说明了jvm在多线程执行<clinit>()方法是同步的
3、类加载器分类
- JVM支持两种类型的类加载器 。分别为
引导类加载器(Bootstrap ClassLoader)
和自定义类加载器(User-Defined ClassLoader)
,其中引导类加载器是由C++编写的。 - 从概念上来讲,自定义类加载器一般指的是程序中由开发人员自定义的一类类加载器,但是Java虚拟机规范却没有这么定义,而是将
所有派生于抽象类ClassLoader的类加载器
都划分为自定义类加载器
-
无论类加载器的类型如何划分,在程序中我们最常见的类加载器始终只有3个,如下所示(这里的箭头并不是指继承关系)
为什么 ExtClassLoader 和 AppClassLoader 都属于自定义加载器
-
规范定义:所有派生于抽象类ClassLoader的类加载器都划分为自定义类加载器
由于BootStrap是由C++编写,所以在java源码中无法找到
AppClassLoader继承树
ExtClassLoader继承树
获取相关类加载器
public class ClassLoaderTest {
public static void main(String[] args) {
// 获取系统类加载器
ClassLoader systemClassLoader = ClassLoader.getSystemClassLoader();
System.out.println(systemClassLoader); // sun.misc.Launcher$AppClassLoader@18b4aac2
//获取上层加载器:拓展类加载器
ClassLoader extClassLoader = systemClassLoader.getParent();
System.out.println(extClassLoader); // sun.misc.Launcher$ExtClassLoader@4554617c
//获取拓展类加载器的上层加载器: 引导类加载器
ClassLoader bootStrapClassLoader = extClassLoader.getParent();
System.out.println(bootStrapClassLoader); // null
// 获取加载当前类的类加载器
// 对于用户来说:默认使用系统类加载器进行加载
ClassLoader classLoader = ClassLoaderTest.class.getClassLoader();
System.out.println(classLoader); // sun.misc.Launcher$AppClassLoader@18b4aac2
// 获取String类的类加载器
// java核心类库都是使用引导类加载器进行加载的
ClassLoader classLoader1 = String.class.getClassLoader();
System.out.println(classLoader1); // null
}
}
- 我们尝试获取引导类加载器,获取到的值为 null ,这并不代表引导类加载器不存在,因为引导类加载器是由 C/C++ 语言构成的,所以我们是获取不到
- 两次获取系统类加载器的值都相同:sun.misc.Launcher$AppClassLoader@18b4aac2 ,这说明系统类加载器是全局唯一的
3.1 虚拟机自带的加载器
3.1.1 启动类加载器(引导类加载器)
启动类加载器( 引导类加载器,Bootstrap ClassLoader )
- 这个类加载使用
C/C++语言
实现的,嵌套在JVM内部 - 它用来
加载Java的核心库
(JAVA_HOME / jre / lib / rt.jar、resources.jar 或 sun.boot.class.path 路径下的内容),用于提供JVM自身需要的类 -
并不继承自java.lang.ClassLoader
,没有父加载器 - 加载扩展类和应用程序类加载器,并作为他们的父类加载器(当他俩的爹)
- 出于安全考虑,Bootstrap启动类加载器只加载包名为
java、javax、sun
等开头的类
3.1.2 扩展类加载器
扩展类加载器(Extension ClassLoader)
-
Java语言编写
,由sun.misc.Launcher$ExtClassLoader
实现 - 派生于
ClassLoader
类 - 父类加载器为启动类加载器
- 从
java.ext.dirs
系统属性所指定的目录中加载类库,或从JDK的安装目录的 jre / lib / ext子目录(扩展目录)下加载类库。如果用户创建的 JAR 放在此目录下,也会自动由扩展类加载器加载
3.1.3 系统类加载器
应用程序类加载器(系统类加载器,AppClassLoader)
-
Java语言编写
,由sun.misc.LaunchersAppClassLoader实现 - 派生于ClassLoader类
- 父类加载器为扩展类加载器
- 它负责加载环境变量
classpath
或系统属性java.class.path
指定路径下的类库 - 该类加载是程序中默认的类加载器,一般来说,
Java应用的类都是由它来完成加载的
- 通过
classLoader.getSystemclassLoader( )
方法可以获取到该类加载器
代码说明
public class ClassLoaderTest1 {
public static void main(String[] args) {
System.out.println("***********启动类加载器*****************");
// 获取BootStrapClassLoader能够加载的api
URL[] urLs = Launcher.getBootstrapClassPath().getURLs();
for (URL element : urLs) {
System.out.println(element.toExternalForm());
}
// 从上面的路径中任意选择一个类,来看看它的类加载器是什么:引导类加载器
ClassLoader classLoader = Provider.class.getClassLoader();
System.out.println(classLoader);
System.out.println("**************拓展类加载器****************");
String extDir = System.getProperty("java.ext.dirs");
for(String path : extDir.split(";")){
System.out.println(path);
}
// 从上面的路径中任意选择一个类,来看看它的类加载器是什么:拓展类加载器
ClassLoader classLoader1 = CurveDB.class.getClassLoader();
System.out.println(classLoader1);
}
}
***********启动类加载器*****************
file:/D:/OpenSource/jdk1.8/jre/lib/resources.jar
file:/D:/OpenSource/jdk1.8/jre/lib/rt.jar
file:/D:/OpenSource/jdk1.8/jre/lib/sunrsasign.jar
file:/D:/OpenSource/jdk1.8/jre/lib/jsse.jar
file:/D:/OpenSource/jdk1.8/jre/lib/jce.jar
file:/D:/OpenSource/jdk1.8/jre/lib/charsets.jar
file:/D:/OpenSource/jdk1.8/jre/lib/jfr.jar
file:/D:/OpenSource/jdk1.8/jre/classes
null
**************拓展类加载器****************
D:\OpenSource\jdk1.8\jre\lib\ext
C:\windows\Sun\Java\lib\ext
sun.misc.Launcher$ExtClassLoader@12a3a380
Process finished with exit code 0
3.2 用户自定义类加载器
为什么需要自定义类加载器?
在Java的日常应用程序开发中,类的加载几乎是由上述3种类加载器相互配合执行的,在必要时,我们还可以自定义类加载器,来定制类的加载方式。
作用:
- 隔离加载类(防止类名重复)
- 修改类加载的方式
- 扩展加载源
- 防止源码泄露
如何自定义类加载器?
- 开发人员可以通过继承抽象类java.lang.ClassLoader类的方式,实现自己的类加载器,以满足一些特殊的需求
- 在JDK1.2之前,在自定义类加载器时,总会去继承ClassLoader类并重写loadClass( )方法,从而实现自定义的类加载类,但是在JDK1.2之后已不再建议用户去覆盖loadClass( )方法,而是建议把自定义的类加载逻辑写在findclass( )方法中
- 在编写自定义类加载器时,如果没有太过于复杂的需求,可以直接继承URIClassLoader类,这样就可以避免自己去编写findclass( )方法及其获取字节码流的方式,使自定义类加载器编写更加简洁。
代码说明
public class CustomClassLoader extends ClassLoader{
@Override
protected Class<?> findClass(String name) throws ClassNotFoundException {
try{
byte[] result = getClassFromCustomPath(name);
if(result == null){
throw new FileNotFoundException();
}else {
return defineClass(name, result,0,result.length);
}
}catch (FileNotFoundException e){
e.printStackTrace();
}
throw new ClassNotFoundException();
}
private byte[] getClassFromCustomPath(String name) {
// 从自定义路径中加载指定类:细节略
// 如果指定路径的字节码文件进行了加密,则需要在此方法中进行解密操作
return null;
}
public static void main(String[] args) {
CustomClassLoader customClassLoader = new CustomClassLoader();
try {
Class<?> clazz = Class.forName("one", true, customClassLoader);
Object instance = clazz.newInstance();
System.out.println(instance.getClass().getClassLoader());
}catch (Exception e){
e.printStackTrace();
}
}
}
3.3 关于ClassLoader
ClassLoader类,它是一个抽象类,其后所有的类加载器都继承自ClassLoader(不包括启动类加载器)
方法名称 | 描述 |
---|---|
getParent( ) | 返回该类加载器的超类加载器 |
loadClass(String name) | 加载名称为name的类,返回结果为java.lang.Class类的实例 |
findClass(String name) | 查找名称为name的类,返回结果为java.lang.Class类的实例 |
findLoadedClass(String name) | 查找名称为name的已经被加载过的类,返回结果为java.lang.Class类的实例 |
defineClass(String name,byte[ ] b,int len) | 把字节数组b中的内容转换为一个Java类,返回结果为java.lang.Class类的实例 |
resolveClass(Class<?> c) | 连接指定的一个Java类 |
获取 ClassLoader 的途径
获取 ClassLoader 的途径 |
---|
方式1:获取当前类的ClassLoader |
clazz.getClassLoader() |
方式2:获取当前线程上下文的ClassLoader |
Thread.currentThread().getContextClassLoader() |
方式3:获取系统的ClassLoader |
ClassLoader.getSystemClassLoader() |
方式4:获取调用者的ClassLoader |
DriverManager.getCallerClassLoader () |
代码说明
public class ClassLoaderTest2 {
public static void main(String[] args) {
try{
// 方式1 引导类加载器
ClassLoader classLoader = Class.forName("java.lang.String").getClassLoader();
System.out.println(classLoader);
// 方式2 系统类加载器
ClassLoader classLoader1 = Thread.currentThread().getContextClassLoader();
System.out.println(classLoader1);
// 方式3 系统类加载器
ClassLoader classLoader2 = ClassLoader.getSystemClassLoader();
System.out.println(classLoader2);
}catch (Exception e){
e.printStackTrace();
}
}
}
4 双亲委派机制
Java虚拟机对 class 文件采用的是按需加载
的方式,也就是说当需要使用该类时才会将它的 class 文件加载到内存中生成 class 对象。而且加载某个类的class文件时,Java虚拟机采用的是双亲委派模式
,即把请求交由上级加载器处理,它是一种任务委派模式
- 如果一个类加载器收到了类加载请求,它并不会自己先去加载,而是把这个请求
委托给上级的加载器
去执行; - 如果上级加载器还存在其上级加载器,则进一步向上委托,依次递归,请求最终将到达
顶层的启动类加载器
; -
如果上级加载器可以完成类加载任务,就成功返回,倘若上级加载器无法完成此加载任务,子加载器才会尝试自己去加载,这就是双亲委派模式
。 -
父类加载器一层一层往下分配任务,如果子类加载器能加载,则加载此类,如果将加载任务分配至系统类加载器也无法加载此类,则抛出异常
代码说明
例1:
假设现在有人无意间创建了一个java.lang包,并在其中创建了一个String类
public class String {
static{
System.out.println("自定义的String");
}
}
编写测试类,看最终加载的是系统的String还是我们自己写的String,如果是我们自己写的就会在Initialization阶段打印出静态代码块
public class StringTest {
public static void main(String[] args) {
java.lang.String s = new java.lang.String();
System.out.println("hello,world");
}
}
hello,world
Process finished with exit code 0
最终输出的内容中并没有静态代码块部分,则说明并没有加载。从这里也看出双亲委派机制,当前类为AppClassLoader加载,它会向上委派给ExtClassLoader,Java.lang.String不属于jre/lib/ext包里,它也会向上委派给BootStrapClassLoader,BootStrapClassLoader在rt.jar中找到这个类,并加载。后续的ClassLoader直接获取即可,就不用加载了。
例2:
public class String {
static{
System.out.println("自定义的String");
}
public static void main(String[] args) {
System.out.println("hello");
}
}
原因:由于双亲委派机制,我们的String类是由引导类加载器加载的,而引导类加载器并没有main方法,所以会报错
例3:
SPI接口是由引导类加载器加载的,接口具体的实现类是由线程上下文类加载器加载的,而线程上下文类加载器就是系统类加载器,所以我们在加载的时候,会先进行双亲委派,在引导类加载器加载SPI核心类,然后加载SPI接口,最后在反向委托,通过系统类加载器进行实现类 jdbc.jar 的加载
例4:
package java.lang;
public class ShkStart {
public static void main(String[] args) {
System.out.println("hello!");
}
}
出于保护机制,java.lang 包下不允许我们自定义类
4.3 双亲委派的优势
- 避免类的重复加载
- 保护程序安全,防止核心API被随意篡改
- 自定义类:java.lang.String 没有调用
- 自定义类:java.lang.ShkStart(报错:阻止创建 java.lang开头的类)
5 沙箱安全机制
自定义String类时:在加载自定义String类的时候会率先使用引导类加载器加载,而引导类加载器在加载的过程中会先加载jdk自带的文件(rt.jar包中java.lang.String.class),报错信息说没有main方法,就是因为加载的是rt.jar包中的String类。
这样可以保证对java核心源代码的保护,这就是沙箱安全机制
。
6 其他
如何判断两个class对象是否相同?
在JVM中表示两个class对象是否为同一个类存在两个必要条件:
- 类的完整
类名必须一致
,包括包名
- 加载这个类的
ClassLoader(指ClassLoader实例对象)必须相同
换句话说,在JVM中,即使这两个类对象(class对象)来源同一个Class文件,被同一个虚拟机所加载,但只要加载它们的 ClassLoader 实例对象不同,那么这两个类对象也是不相等的
对类加载器的引用
- JVM必须知道一个类型是由启动加载器加载的还是由用户类加载器加载的
- 如果一个类型是由用户类加载器加载的,那么JVM会将这个
类加载器的一个引用
作为类型信息的一部分保存在方法区
中 - 当解析一个类型到另一个类型的引用的时候,JVM需要保证这两个类型的类加载器是相同的
类的主动使用和被动使用
Java程序对类的使用方式分为:主动使用
和 被动使用
。
主动使用,又分为七种情况:
- 创建类的实例
- 访问某个类或接口的静态变量,或者对该静态变量赋值
- 调用类的静态方法
- 反射( 比如:Class.forName(“cn.sxt.Test”) )
- 初始化一个类的子类
- Java虚拟机启动时被标明为启动类的类
- JDK7开始提供的动态语言支持:java.lang.invoke.MethodHandle实例的解析结果REF_getStatic、REF putStatic、REF_invokeStatic句柄对应的类没有初始化,则初始化
除了以上七种情况,其他使用Java类的方式都被看作是对类的被动使用
,都不会导致类的初始化,即不会执行初始化阶段(不会调用 clinit( ) 方法和 init( ) 方法)