JVM内存模型详解
1.基本概念
JVM实际上是运行在一个具体操作系统上的程序进程,对Java代码而言,JVM就是操作系统的代理。
如图所示是JVM的内存模型及数据交互。JVM的内存模型依然是基于操作系统进程空间的,不过是自己设计了一套内存管理体系以支撑上层的Java代码。
JVM的运行时内存可以简单的分为线程私有和公共内存,线程私有部分包含程序计数器、Java栈、native方法栈。全局公共部分包含方法区、堆空间。
2.程序计数器
不止是JVM,操作系统本身就有程序计数器的概念,可以把JVM的程序计数器看做是对操作系统本身程序计数器的一种抽象。
程序计数器会记录当前线程下一条字节码的位置。当线程被挂起然后被恢复的时候,会根据程序计数器恢复线程的执行逻辑。特别的,如果该线程正在执行一个native方法,那么此时线程寄存器的值为”undefined”。
3.Java方法栈
Java栈也是线程私有的。每个方法在执行的时候都会同时生成一个栈帧,用于存储局部变量、操作数栈、动态链接、方法出口等信息。方法执行从开始到结束的过程,对应了栈帧在虚拟机Java栈中从入栈到出栈的过程。
局部变量表中存储了基本类型及引用类型(即对象的指针),其中64位长度的long和double类型的数据会占用2个局部变量空间(Slot),其余的数据类型只占用1个。局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。
4.native方法栈
native方法栈与Java方法栈类似,不过native方法栈是为虚拟机使用到的native方法服务的。
Java虚拟机规范对于这块没有强制规定,因此Sun HotSpot甚至直接就把native方法栈和Java方法栈合二为一。
5.Java堆
Java堆(Java Heap)是Java虚拟机所管理的内存中最大的一块。Java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配内存。这一点在Java虚拟机规范中的描述是:所有的对象实例以及数组都要在堆上分配。
Java堆是垃圾收集器管理的主要区域,因此很多时候也被称做“GC堆”。关于Java堆的详细结构,也需要和GC机制一起来讲才能比较清楚的理解,此处先跳过。
通过虚拟机启动参数,我们可以控制Java堆的最大内存占用,如果超过最大内存,会触发OutOfMemory异常,进而导致内存申请失败。如果出现这种异常,就要考虑是参数设置太小还是存在堆内存泄露。
6.方法区
方法区(Method Area)与Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做Non-Heap(非堆),目的应该是与Java堆区分开来。
对于习惯在HotSpot虚拟机上开发、部署程序的开发者来说,很多人都更愿意把方法区称为“永久代”(Permanent Generation),本质上两者并不等价,仅仅是因为HotSpot虚拟机的设计团队选择把GC分代收集扩展至方法区,或者说使用永久代来实现方法区而已,这样HotSpot的垃圾收集器可以像管理Java堆一样去管理这部分内存。
但是使用永久代来实现方法区,并不是一个好主意,因为这样更加容易遇到内存溢出问题,永久代的内存分配一般比较小且固定,但是当碰到String.intern这种运行时占用永久代内存空间的方法的时候,很容易导致永久代内存不够用。因此在jdk1.7中,已经把放在永久代中的字符串常量池移入到堆内存当中了。
7.运行时常量池
运行时常量池是方法区的一部分,存放了class文件在编译期生成的各种字面量和符号引用。这部分内容在类加载的时候放入运行时常量池中。
运行时常量池是动态变化的,不止存储了class文件在编译期生成的各种字面量,运行期间也可能放入新的常量,比如String类的intern方法。
8.直接内存
直接内存并不是虚拟机运行时区域的一部分,也不是Java虚拟机规范定义的内存区域。JDK 1.4中新加入的NIO类,引入了一种基于通道和缓冲区的I/O方式,它可以使用native函数库直接分配堆外内存,然后通过一个存储在Java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。这样做是为了能在一些场景中显著提高性能,因为避免了Java堆和native堆来回复制数据。
本机直接内存的分配不受到Java堆的大小限制,但会受到物理内存和操作系统的限制。