Java虚拟机在执行Java程序时会把它所管理的内存划分为几块区域,分别用于负责不同的任务。有些区域的创建和销毁依赖于虚拟机进程,有的则依赖于用户线程的创建和销毁。废话不多说,我们来看看JVM运行时内存区域具体是个什么鬼,先看张图:
原谅我不会画图,凑合着看看哈~
我们从图上可以看到,Java虚拟机在运行程序时,并非所有的内存数据都同等对待,分为线程共享和线程私有的两种区域。线程共享即所有的线程都可以访问该区域的数据,而私有内存是伴随线程的创建而创建的区域,只对当前线程可见,并伴随线程的销毁而回收。
我们接着来看两种区域下更细致的划分:
一、共享内存
-
Java堆(Java Heap)
在绝大多数情况下,Java堆算得上是JVM中空间最大的区域,因为这里的唯一作用就是存放程序中实例化的对象,几乎所有的对象实例都会在这里分配内存空间。它被所有线程共享,伴随着Java虚拟机的启动而创建。
Java堆可以是物理上不连续的内存空间,但要求必须保证逻辑连续。在实现方面,可以设置为固定大小,也可以是可扩展的,主流的虚拟机是通过 -Mmx和 -Mms 进行配置实现。如果堆的剩余空间不足以分配实例对象需要的空间,且无法继续扩展,则会抛出OutOfMemoryError异常。
那Java虚拟机怎么解决空间不足的问题呢?答案是内存回收 - 垃圾收集机制,即依赖垃圾收集器回收已经“死掉”的对象所占用的内存,以供后续新创建的对象使用。Java堆是垃圾收集器主要管理的区域,所以也叫做“GC堆”(Garbage Collected Heap)。目前主流的虚拟机实现收集器都采用分代收集算法,大致做法就是将Java堆细分为Eden区、From Survivor区、To Survivor区,新创建的对象优先会在Eden区分配空间,有的虚拟机还支持开启本地线程缓冲区(Thread Local Allocation Buffer. TLAB),(WTF,什么鬼玩意儿!)别慌,这个缓冲区只是为了帮助更快速地分配和回收内存,可以先不了解具体原理,但要知道如果开启了这个缓冲区,则优先在TLAB区域分配空间。当然一些例外的大对象,会直接在老年代分配内存空间,这么做是为了避免对象老年化的时候迁移大量数据。
对象的回收算法还有标记-清除算法、复制算法、标记-整理算法,关于GC的收集算法,后续会单独介绍。 -
方法区(Method Area)
方法区中存储的是已被虚拟机加载完毕的类信息、常量、静态变量以及即时编译器编译后的代码等数据。不同的虚拟机对方法区的实现方式各不相同,HotSpot虚拟机上采用永久代的方式来实现方法区,但这样容易遇到内存溢出的问题(永久代有 -XX:MaxPremSize的上限)。现在HotSpot虚拟机已经逐步采用Native Memory的方式来代替永久代,JDK1.7版本的HotSpot中,已经把原本放在永久代的字符串常量池移出。注意,这里指的是字符串常量池将不属于永久代,但仍属于方法区的一部分,即永久代并不等价于方法区。
方法区和堆区一样,是所有线程共享的区域,并且Java虚拟机规范认为方法区是堆的一个逻辑部分,但实际上和堆是有区分的,它还有一个别名“Non-Heap”,即非堆。最大的不同之处是内存回收方面,Java虚拟机规范不要求方法区必须实现垃圾收集,这不代表方法区的数据会“长生不死”,方法区的回收目标主要是常量池的回收和类型的卸载,严格意义来讲,这些区域的内存回收也很有必要。 -
运行时常量池(Runtime Constant Pool)
运行时常量池是方法区的一部分,它的作用是存放编译期生成的字面量和符号引用,这些数据来自于Class文件的常量池(Constant Pool Table),出这些之外,运行时常量池还会存放翻译后的直接引用。相较于Class文件的常量池,运行时常量池还具有动态性,这意味着其中存放的常量不仅仅是在编译期产生,还会在运行期存放新的常量。
二、线程私有内存
-
Java虚拟机栈(Java Virtual Machine Stacks)
虚拟机栈是对Java方法执行过程中的内存模型的描述。可以这么描述:每个方法在执行的时候会在虚拟机栈中创建一个对应的栈帧(Stack Frame)用于存储方法中的局部变量表、操作数栈、动态链接、方法出口等信息。该方法的调用、执行、完成的过程,对应着栈帧在虚拟机栈中的入栈到出栈的过程。局部变量表存放的数据有以下几种:
a. 了编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)
b. 对象引用(reference,是一个指向对象起始地址的引用指针或者是指向代表对象的句柄)
c. returnAddress类型(指向了一条字节码指令的地址)
值得关注的是,局部变量表所需要的内存大小是在编译期确定并且完成分配,运行期不会动态改变局部变量表的大小。如果线程请求的栈深度大于虚拟机所允许的深度,会抛出StackOverFlowError异常;如果无法申请到足够的内存,则会抛出OutOfMemoryError异常。 -
本地方法栈(Native Method Stack)
本地方法栈和虚拟机栈的作用几乎一致,但本地方法栈的服务对象是虚拟机所使用到的Native方法,而虚拟机栈是服务于虚拟机执行的Java方法。在Sun公司的HotSpot虚拟机的实现中,本地方法栈和虚拟机栈被放到了一起实现。 -
程序计数器(Program Counter Register)
这是一块比较小的内存空间,它用于指定当前线程正在执行的字节码的行号,也叫行号指示器。基于这一点作用,就决定了程序计数器必须是线程私有的内存区域,因为在处理器的每个内核中,任意时刻都只会执行一个线程中的一个指令,只有保证程序计数器是线程独立的,线程之间的执行才不会因为处理器切换线程而互相影响。注意一点,如果当前线程正在执行Java方法,则计数器记录的正在执行的虚拟机字节码指令的地址;如果正在执行Native方法,则计数器值为空(Undifined)。
三、直接内存(Direct Memory)
首先声明一点,直接内存并不属于Java虚拟机运行时内存区域。那这块区域是干什么的呢?它是JDK1.4引入NIO以后,基于通道(Channel)和缓冲区(Buffer)的I/O方式,使用Native函数库直接分配的堆外内存区域。在Java堆中会存储着一个对应的DirectByteBuffer对象作为这块堆外内存的引用,避免在Java堆和Native堆中来回复制数据。
直接内存的大小不会收到Java堆的内存限制,但是会受到本机总内存大小和处理器寻址空间的限制。