前言
JVM 是 Java Virtual Machine(Java虚拟机)的缩写,它是一种规范,HotSpot VM是其最主流的实现(其他实现),通常我们讨论JVM如果没有特意说明是何种实现,便指的是HotSpot VM。JVM也并非仅支持Java语言,任何可编译为字节码的编程语言能可以运行在JVM上,例如前不久谷歌在 I/O 2017宣布将作为 Android 开发 First-Class 语言的 Kotlin。JVM定义了一些运行时数据区以便执行程序时候所用,一部分数据区在虚拟机启动时创建,在虚拟机退出时销毁,另外一些数据区是针对每个线程的,这些数据区是和线程的生命周期相同,即随着线程的创建而创建销毁而销毁。理解这些区域对于进一步理解JVM和编写并发程序是非常重要的,本文将结合作者自己的理解对各区域做一粗浅的解析,不对之处,望指出,共勉。
程序计数器(Program Counter Register)
程序计数器是一块较小的内存空间,它的作用可以看做是当前线程所执行的字节码的行号指示器。在虚拟机的概念模型里(仅是概念模型,各种虚拟机可能会通过一些更高效的方式去实现),字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
由于JVM的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时刻,一个处理器(对于多核处理器来说是一个内核)只会执行一条线程中的指令。因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间的计数器互不影响,独立存储,我们称这类内存区域为“线程私有”的内存。
如果线程正在执行的是一个Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是Natvie方法,这个计数器值则为空(Undefined
)。此内存区域是唯一一个在JVM规范中没有规定任何OutOfMemoryError
的区域。
简单来说,程序计数器就是为了在多线程下,切换线程后让CPU知道它应该从何处继续工作。
虚拟机栈(VM Stack)
每个线程有一个私有的栈,随着线程的创建而创建。栈里面存着的是一种叫“栈帧”的东西,每个方法会创建一个栈帧,栈帧中存放了局部变量表(基本数据类型和对象引用)、操作数栈、方法出口等信息。下面这个例子,也许会让你更容易理解它。
public class Test {
public static void main(String[] args) {
method1();
}
public static void method1(){
method2();
}
public static void method2(){
method3();
}
public static void method3(){
System.out.println("invoke method3");
}
}
栈的大小可以固定(通过
-Xss
控制)也可以动态扩展。当栈调用深度大于JVM所允许的范围,会抛出StackOverflowError
的错误,比如执行下面这段代码。
public class Test {
public static void main(String[] args) {
main(args);
}
//Exception in thread "main" java.lang.StackOverflowError
}
由于栈随着线程的创建而创建,如果在并发环境下,线程过多以至于无法再申请到内存时会抛出OutOfMemoryError
错误,通常可以通过增大物理内存来解决。
公式:最大线程数 = (物理内存 - 堆内存 - 方法区) / 栈大小
公式:栈占用内存 = (程序计数器内存 + 栈大小) * 线程数
本地方法栈(Native Method Stack)
与虚拟机栈所发挥的作用是非常相似的,其区别不过是虚拟机栈为虚拟机执行Java方法(也就是字节码),而本地方法栈则是为虚拟机使用到的Native方法(例如:public native int hashCode();
)。虚拟机规范中对本地方法栈中的方法使用的语言、使用方式与数据结构并没有强制规定,因此具体的虚拟机可以自由实现它。甚至有的虚拟机(比如Sun HotSpot虚拟机)直接就把本地方法栈和虚拟机栈合二为一。与虚拟机栈一样,本地方法栈区域也会抛出StackOverflowError
和OutOfMemoryError
错误。
堆(Heap)
对于大多数应用来说,堆是JVM所管理的内存中最大的一块,也是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配内存,可谓是对象的大本营。此外,堆也是垃圾收集器(GC)管理的主要区域。
根据 JVM 规范的规定,Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可,就像我们的磁盘空间一样。在实现时,既可以实现成固定大小的,也可以是可扩展的,不过当前主流的虚拟机都是按照可扩展来实现的(通过-Xmx
和-Xms
控制)。如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出OutOfMemoryError
错误,比如执行下面这段代码。
public class Test {
public static void main(String[] args) {
List list = new ArrayList();
while (true) {
//重复的向list内添加1MB大小的数据,由于list内元素不符合GC回收条件进而导致OOM。
list.add(new byte[1024 * 1024]);
}
}
//Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
}
方法区(Method Area)
方法区与堆一样也是被所有线程共享的一块内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器(JIT)编译后的代码等数据。方法区逻辑上属于堆的一部分,但是为了与堆进行区分,通常又称“非堆”(Non-Heap)。
在Java 8 之前很多人愿意把方法区称为“永久代”(Permanent Generation),本质上两者并不等价,方法区是JVM的规范,而“永久代”仅仅是因为Hot Spot虚拟机的设计团队选择把GC分代收集扩展至方法区,或者说使用永久代来实现方法区而已。对于其他虚拟机(如BEA JRockit、IBM J9等)来说是不存在永久代的概念的。即使是HotSpot虚拟机本身,在Java 8 也放弃了“永久代”,取而代之的是以本地内存(Native Memory)来实现方法区的“元空间”(Metaspace),进一步了解。
根据 JVM 规范的规定,当方法区无法满足内存分配需求时,将抛出
OutOfMemoryError
错误。
各数据区常见 JVM 参数
注:在Java 8 及以上版本-XX:PermSize
和-XX:MaxPermGen
已经失效,请使用-XX:MetaspaceSize
和-XX:MaxMetaspaceSize
替代。
参考
- The Java® Virtual Machine Specification - Java SE 8 Edition
- 《深入理解Java虚拟机(第2版)》
- Java 8 内存模型—永久代(PermGen)和元空间(Metaspace)