在java当中,因为内存管理完全由java虚拟机完成,因此为了在发生内存泄露和内存溢出等问题时,更快的理解和定位问题,有必要对java的内存区域划分进行了解。本文主要参考《深入理解java虚拟机》,整理内容仅供自己复习所用。
java虚拟机中主要包含以下几个数据区域:
程序计数器、本地方法栈、虚拟机栈、方法区、堆内存
1.程序计数器
程序计数器指向下一条待执行的字节码指令地址,java解释器根据这个地址取指令。由于java虚拟机中在实现多线程的时候会对线程进行切换,因此每一个线程都需要记录下自己被切换前待执行的那条字节码地址。所以,对于每一个线程,都会有这么一个线程计数器,各线程间的计数器互相独立,这被称为线程私有的。
这个区域是唯一没有被规定OutOfMemoryError的地方(似乎没有实际应用意义,仅作了解)。
2.java虚拟机栈
在学习java的时候,对java虚拟机中的堆内存、栈内存仅有一个模糊的认知,即对象创建在堆内存,是线程共享的,而局部变量都存在栈内存中,是各线程私有的。这里所提到栈内存即为java虚拟机栈(更准确的应该是虚拟机栈当中的局部变量表)。
与程序计数器相同的是,java虚拟机栈也是线程私有的,且一般和线程同生共死。其描述的是java方法执行的内存模型,每个方法在执行时会创建一个栈帧(目前还没细细研究,抽空专门一篇关于栈帧),存储局部变量表、操作数栈、动态链接、方法出口等信息。
局部变量表:
存放了编译器可知的8类基本数据类型(boolean、byte、char、short、int、float、double、long)、对象引用和returnAddress类型。局部变量表所需的内存空间在编译器完成编译,当进入方法时,该方法在栈帧中分配多大的局部变量空间是完全确定的,运行时不会改变其局部变量表大小。
操作数栈:
操作数栈和局部变量区一样。也被组织成一个以字长为单位的数组。但是操作数栈不通过索引来访问,而是通过标准栈操作--压栈和出栈来访问。虚拟机在执行方法时,进行算术运算或调用其他方法进行参数传递时都会将利用操作数栈进行操作。操作数栈中大多数指令都要从这里弹出数据,执行运算,然后把结果压回操作数栈。
动态链接:
每个栈帧都包含一个执行运行时常量池中该栈帧所属方法的引用,持有这个引用是为了支持方法调用过程中的动态连接(Dynamic Linking)。
Class 文件中存放了大量的符号引用,字节码中的方法调用指令就是以常量池中指向方法的符号引用作为参数。这些符号引用一部分会在类加载阶段或第一次使用时转化为直接引用,这种转化称为静态解析。另一部分将在每一次运行期间转化为直接引用,这部分称为动态连接。
方法出口:
这一点我不是明确,根据目前的理解,记录的是当方法结束后下一条待执行指令的地址,一般应为方法调用者程序计数器的值,当方法正常执行并return后,程序会执行方法出口所指向的指令。当一个方法出现异常且其内部没有处理异常时,此时没有返回值,称为异常完成出口,返回地址需要根据异常处理器进行确定。
最后,java虚拟机栈可能出现两种异常:stackOverFlowError和OutOfMemoryError异常。当线程请求的栈深度大于虚拟机所允许的深度,将会跑出stackOverFlowError。若虚拟机栈可以动态扩展,那么当其动态扩展时无法申请到足够的内存,则会跑出OutOfMemoryError异常。
3.本地方法栈
本地方法栈与java虚拟机栈作用类似,不同点在于虚拟机栈为java方法服务,本地方法栈为Native方法服务。
4.java堆
java堆一般是java虚拟机中所管理内存中最大的一块,也是主要进行GC的区域。java堆为线程共享的内存区域,在虚拟机启动时就会创建。
在java堆中,从GC的角度上可以划分为新生代和老年代。更细化可谓Eden区、From Survivor区、 ToSurvivor区。这些可在GC部分详细介绍。
java堆可以处于物理上不连续的内存空间上,只要保证逻辑连续即可,详情可参考计算机操作系统内存管理。目前主流java虚拟机都是设计为可扩展的(可通过-Xmx和-Xms设置),当堆内存不足时会跑出OutOfMemoryError。
5.方法区
方法区也是一块线程共享的区域,用于存储虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码。
其中类信息包括:类名、访问修饰符、常量池、字段描述、方法描述等。
运行时常量池
运行时常量池是方法区的一部分,Class文件中包含了类的版本、字段、方法、接口等信息,另外包含一项常量池,用于存放编译器生成的各种字面量和符号引用,这类信息将在类加载后进入方法区的运行时常量池中存放
运行时常量池相对Class文件常量池的一个重要特征是具有动态性,在程序运行期间也能将新的常量放入常量池当中。(虽然我不知道其应用场景)