运行时数据区主要包括程序计数器、虚拟机栈、本地方法栈、方法区、堆。
程序计数器、虚拟机栈和本地方法栈是线程独立的,方法区和堆是线程共享的,在虚拟机启动时创建。
程序计数器可看作是当前线程执行字节码指令的行号指示器。字节码解释器工作时就是通过改变计数器的值来取得下一条需要执行的字节码指令,分支,循环,异常处理和线程恢复都要依靠这个程序计数器。
java虚拟机栈,存放当前线程运行方法执行时所需要的数据,指令和返回地址,是一个栈,先入后出的特性,这个栈里面有局部变量表和操作数栈和动态链接和方法出口等信息。它描述的是java方法执行的内存模型。每个方法执行的时候都会创建一个栈针,这个栈针里面会存放(局部变量表和操作数栈和动态链接和方法出口)信息。局部变量表中存放的数据是八大基本数据类型和执行堆中对象的句柄的引用。
本地方法栈和虚拟机栈类似,虚拟机栈执行的是字节码服务,本地方法栈执行的是虚拟机中使用到的native方法服务。
方法区存放类的信息,常量,静态变量、jit即时编译后的字节码文件。类加载子系统负责从文件中或者网络中加载class信息,加载的类信息存放的地方就是方法区。方法区中还存放这常量池信息。包括字符串字面量(两个引号标记之间的字符序列)和字符串常量。
堆是所有线程共享的一块内存空间,在虚拟机启动时创建,所有的对象实例和数组都在堆上分配,由于现在GC收集器都有分代回收的算法,堆的细粒度的划分,则有eden(伊甸园),survivor(from,to区),这几个区是新生代的区,还有老年代,永久代。都是意译。
新创建的对象会在eden区分配内存,经过多次回收存活下来的对象放在老年代中,静态属性和类信息存放在永久代中。永久代是存在于hotspot虚拟机中的概念。永久代和方法区中存放的东西有点类似。
新生代,老年代,永久代就像是一个漏斗,最终跑到永久代。新生代的对象存活时间短,只需要在新生代进行频繁的GC,老年代的对象生命周期长,内存回收的频率较低,永久代中回收效果较差,一般不进行垃圾回收。永久代在java1.8之后将被取缔。注意一下,堆里永久代存储的东西和方法区很类似,主要是为了节省内存空间。
eden,from,to的区域划分比例默认是8:1:1,之所以给eden区分配这么大的内存空间,是因为大部分的内存回收都在eden区,没有必要给survivor区分配很多的内存空间。对象只存在于eden区和from区,to区是空的(作为保留区域),当eden区没有足够的内存空间进行分配时,则进行一次minor GC,当GC开始时,eden区存活对象全部复制到to区,from区的存活对象需要根据的年龄值决定去向(新生代的对象没经过一次GC,年龄值+1,GC的分代年龄值存放在header中),当达到阈值的时候则进入老年代,没有达到阀值的就放入to区域,接着就交换from区和to区的角色,总之,不管总要都要保证新的to区是空的,gc时当to区没有存够的内存空间存入上一次新生代收集过来的存活对象,需要老年代进行担保,将这些对象放入老年代中。
这样我们可以看出来,其实这个GC分配下来,实际上就是一个收集生命周期时间长到老年代的一个过程,然后大部分的内存回收都是在eden区中,这样的话就节省效率了。
关于JVM运行时数据区就介绍到这里。下面介绍GC常规算法:
1、引用计数法(比较古老的算法,就是给引用的对象加上标记,此对象有一个引用,就加一个计数,删除一个引用,就减少一个计数,垃圾回收时,只用收集计数为0的对象)
2、复制算法。这个算法需要将内存分为两个相等的区域,每次只使用一个区域,垃圾回收时,只处理正在使用的内存空间,把正在使用的对象复制到另一个区域,gc算法每次都处理存活的对象,因此复制成本低,同时复制过去进行相应的内存整理,不会出现“碎片”问题,但是这个算法的缺点也很明显,需要两倍的内存空间。(蓝色的正在使用的,灰色的是被回收的,绿色的是未被使用的)
3、标记清除算法(mark-sweep)
此算法执行需要分为两个阶段。第一阶段从引用的根节点开始标记被使用的对象,第二阶段遍历整个堆,把未标记的对象清除,此算法需要暂停整个应用,同时会产生内存碎片。
4、标记-整理算法
此算法综合了“复制算法”和“标记-清除”算法的优点。第一阶段是从引用的根节点标记被使用的对象,第二阶段遍历整个堆,把未标记的对象清除并把存活的一块压缩到堆的其中一块,按顺序存放,此算法避免了复制算法的浪费空间问题,也避免了“标记清除”算法的碎片化问题。
JVM垃圾收集器