写在前面
最近在学习Java的相关知识,在面向对象的部分就碰到了内存管理和分配的问题。所以撰文一则来和大家共同讨论,如有不正确或者不完善的地方,麻烦大家帮忙指出。
文中的图片均为手绘而成,如需转载麻烦私信我哈~
由于JVM内存相关的内容较长,我打算分四期来写,预计内容如下:
1.JVM运行时内存区域模型
2.结合代码剖析JVM运行时内存区域
3.JVM内存分配过程
4.JVM堆区详解和GC过程
Java内存模型图解
JVM运行时内存区和本地内存
JDK8中移除了永久区(方法区),而采用Metaspace(元空间)代替。Metaspace 区域位于堆外,所以它的最大内存大小取决于系统内存,而不是JVM的堆大小。
按照区域划分:
- JVM运行时内存区:Stack栈,Heap堆,Code Cache代码缓存
- 本地内存:Direct Memory直接内存,Metaspace元空间
按照线程私有/共享划分:仅Stack是线程私有的,其他均为线程共享
【1】【Stack 栈】
每个线程私有一个栈,栈的数据不能跨线程共享。该栈的生命周期与所属线程关联。
如果出现无限递归,有可能会超出栈内存的允许值(在64位 Linux系统中默认为1M,一般不需要手动修改),此时会抛出StackOverflowError。如果当前JVM允许栈的大小动态扩展,而当前已无更多可扩展的内存时,会抛出OutOfMemoryError。
【1.1】【Program Counter 程序计数器】
在多线程场景下,对于一个CPU核只能同时有一个线程在跑,那么在线程切换时,之前的线程就会被挂起;当线程恢复时需要从之前运行的位置继续向下执行 —— 所以需要使用【Program Counter 程序计数器】存储线程当前执行到的字节码的行数。
除了线程恢复外,分支、循环、跳转、异常处理基础功能都需要依赖这个计数器来完成。
注1:如果当前线程正在执行的为Native方法(非Java程序)则程序计数器中数值为空(Undefined)。
注2:由于程序计数器存储的数据大小恒定,不需要扩大,所以该区域为唯一一个不会产生OutOfMemoryError的区域。
【1.2】【Stack Java栈】
每个方法执行时,都会创建一个栈帧来存储。方法从调用到结束就是一个栈帧在栈中的入栈和出栈的过程。
下面我们来详解栈帧的构成:
- 【1.2.1】【Return Values 返回值/地址】方法退出时的返回值,如果发生异常并且未在方法内处理则没有返回值。
- 【1.2.2】【Local Variables 本地/局部变量表】
- 用于存储方法的形参和方法内部定义的局部变量,其大小在编译时已经确定,在运行期间不会改变。
- 局部变量表的存储单位为Slot(变量槽),每个Slot可以存放一个32位的基础类型数据或者引用;对于64位的数据如Long,Double等则需要占用两个Slot
- 为了节省空间,Slot是可以重用的,当变量出了作用域后,它所占用的slot即可被重用,比如这里的k就可以重用j的slot:
public static void methodTwo() {
if (true) {
int j = 0;
}
if (true) {
int k = 1;
}
return;
}
- 【1.2.3】【Operand Stack 操作数栈】提供给方法内部的计算过程使用;
- 【1.2.4】【动态链接】这个部分比较晦涩,以下是我的个人理解 ——
符号引用:方法名称,比如xx类的yy方法
直接引用:将方法名称解析为字节码中的准备地址,比如xx.class的n行是yy方法的字节码
通过栈帧中的这个动态链接,可以将对当前方法的引用转换为直接引用,即当前方法的准确字节码位置。结合【1.1】的Program Counter可以找到下一条需要执行的指令。
【1.3】【Native Stack 本地方法栈】
非Java实现的,其他OS提供的方法运行时的栈,一般指C语言,所以又称作C栈。
本地方法栈基本和JVM栈一样,其大小也是可以设置为固定值或者动态增加,因此也会对应抛出StackOverflowError和OutOfMemoryError错误。
【2】【Heap 堆】
堆是多线程共享的。用于存放对象的实例(new出来的对象)和数组的值。
【2.1】字符串常量池
JDK7时该部分从方法区移到了堆中
【2.2】实例存储
1.每一个new出来的数据都会在堆上分配地址和默认值。比如引用类型默认值是null,int类型默认是0。
2.与栈上存储的局部变量数据在方法结束后自动释放不同,堆上的数据在使用过后需要等待GC进行释放。
3.如果堆内存剩余的内存不足以满足于对象创建,JVM会抛出OutOfMemoryError错误。
我准备在本系列文章的第四篇再详解堆区的结构以及与之相关的GC策略。
【3】【Code Cache 代码缓存】
存储JVM生成的字节码(.class文件信息)的内存区域;
其中包括类编译后的字段、方法、接口和静态常量池。
静态常量池与【5.2.1】运行时常量池的代码示例和二者联系详解请见我的系列文章之:2.结合代码剖析JVM运行时内存区域
【4】【Direct Memory 直接内存】
直接内存是使用 Native 函数库直接分配的堆外内存,不受 Java 堆大小的影响,也不属于JVM运行时内存区域。其空间动态扩展内存不够时也会抛出 OutOfMemoryError 异常。
JDK1.4中新加入的NIO类,引入了基于通道和缓冲区的I/O方式,他可以直接分配对外内存,以提高性能。
【5】【Metaspace 元数据】
Metaspace 是用来存放 class metadata 的,class metadata 用于记录一个 Java 类在 JVM 中的信息。
对于该区域详细了解可以参考这篇翻译的文章:深入理解堆外内存 Metaspace
【5.1】【Compressed Class Space】
Klass 结构:这个非常重要,可以理解为一个 Java 类在虚拟机内部的表示;
压缩指针:
- 指的是在 64 位的机器上,使用 32 位的指针来访问数据(堆中的对象或 Metaspace 中的元数据)的一种方式。
- 这样有很多的好处,比如 32 位的指针占用更小的内存,可以更好地使用缓存,在有些平台,还可以使用到更多的寄存器。
- 当然,在 64 位的机器中,最终还是需要一个 64 位的地址来访问数据的,所以这个 32 位的值是相对于一个基准地址的值(使用时再加一个base值进行转换)。
由于 32 位地址只能访问到 4G 的空间,所以最大只允许 4G 的 Klass 地址。这项限制也意味着,JVM 需要向 Metaspace 分配一个连续的地址空间,即——Compressed Class Space
【5.2】【Non-Class Space】
用于存储Class Metadata(元数据)中除了Klass结构之外的内容,比如【5.2.1】运行时常量池和【5.2.2】方法的元数据(如方法名、返回值、字节码、参数信息)等
参考
1.线程栈默认大小
2.Oracle JVM Stack规范
3.你必须了解的java内存管理机制(一)-运行时数据区
4.Java运行时数据区域是如何工作的 | JVM内存布局 对象访问定位
5.聊聊JVM的Code Cache
6.方法区和常量池
7.Java学习笔记--内存划分堆栈方法区
8.深入理解堆外内存 Metaspace
9.精美图文带你掌握 JVM 内存布局
10.Metaspace 之一:Metaspace整体介绍(永久代被替换原因、元空间特点、元空间内存查看分析方法)