概述
下文主要分为以下几个大模块进行JVM的GC解读:
- 垃圾回收之标记算法
- 垃圾回收之回收算法
- 堆内存年轻代垃圾收集器
- 堆内存老年代垃圾收集器
1.垃圾回收之标记算法
既然是垃圾回收,首先就是要判断哪些对象实例是垃圾,可以被回收,标记算法的用处就在于此
引用计数法
Java中通过引用关联对象,显然可以通过引用计数的方式来判断一个对象是否可以被回收。如果一个对象没有和任何一个引用相关联,那这个对象就可以被回收。这种算法实现方式简单,效率高,但是无法解决循环引用的问题,如下这段代码:
public class Main {
public static void main(String[] args) {
MyObject object1 = new MyObject();
MyObject object2 = new MyObject();
object1.object = object2;
object2.object = object1;
object1 = null;
object2 = null;
}
}
class MyObject{
public Object object;
}
由于object1和object2相互引用对方,它们的引用计数永远不为0,永远不会被标记而回收
可达性分析法
Java中采取的就是可达性分析算法。此算法以GC Root为起点进
行引用链搜索,如果GC Root和目标对象之间没有可达路径,则此对象不可达,但是成为可被回收的对象需要经历两次可达性分析算法的标记分析,如果两次都被标记不可达才会被作为”垃圾“。
常见的GC Root有哪些呢?
- 虚拟机栈中的引用对象
- 方法区中的常量引用对象
- 方法区中静态属性引用对象
- 本地方法栈栈中JNI的引用对象
- 活跃线程的引用对象
2.垃圾回收之回收算法
标记算法完成了”垃圾“的标记,下一步就是回收这些”垃圾“
标记-清除算法(mark-sweep)
标记-清除算法分为两步骤,第一步就是利用标记算法找到”垃圾“,第二步清除可被回收的对象。此算法思路简单易于实现,但是从上图中可以看出标记-清除算法比较容易导致内存碎片化,如果有较大的对象需要存储时,可能无法找到足够的内存空间存储,从而又触发一次新的垃圾回收动作
复制算法(copying)
为了解决标记清除算法导致的内存碎片化问题,就有了复制算法。
它把内存空间分为两大块,一块为对象面,一块为空闲面;新创建的对象都在对象面上,直到对象面内存空间满了,把对象面里不是垃圾的存活对象全部复制到空闲面,然后把整个对象面内存空间全部清除,如下图:
此算法虽然避免了内存碎片化,但是可使用的内存空间却减少了一半,并且此算法效率和存货对象的数目有很大关系,适用于存活对象数目较少的情况
标记-整理算法(mark-compact)
标记整理算法是标记清除算法的更近一步,在完成垃圾标记后,不是直接清除,而是把存活对象都移动至内存一端,按照地址顺序排列,最后把末端地址后的内存空间全部清除,如下图:
此算法避免了内存碎片化,也不需要把内存空间分为两大块,适用于存活对象较多的情况
分代收集算法(generational-collection)
此算法是目前大部分JVM采取的垃圾收集算法,效率最高。它可以理解为一套”组合拳“算法,JVM根据对象的生命周期将堆划分为年轻代和老年代,新生代的特点就是每次垃圾回收有较多的垃圾需要回收,老年代的特点就是每次垃圾回收有较少的垃圾需要回收。
因此对于年轻代的垃圾回收一般采用复制算法,因为年轻代的存活对象较少,反之老年代一般采用标记整理算法,因为老年代的存活对象较多。
年轻代单独的垃圾回收被称为Minor GC,年轻代的内存划分其实并不像复制算里面描述的分为1:1,而是分为一个较大的Eden区和两个较小的Survivor区,大致空间大小划分如下:
使用新代时,只使用Eden区和其中一个Survivor区,另一个Survivor区空闲。当进行Minor GC时把Eden区和Survivor区中的存活对象复制到另一个空闲的Survivor区,然后清除Eden区和使用过Survivor区。
整个堆的垃圾收集(包括年轻代和老年代)被称为Full GC,也就是当触发Full GC时同时也会触发Minor GC,Full GC的时间大概是Minor GC的十倍。触发Full GC有以下几个条件:
- 老年代空间不足
- 调用System.gc()
- 还有几个我也不记得了
关于垃圾回收的几个JVM性能调优参数
- -XX:SurvivorRatio:新生代中Eden区Survivor区大小的比值,默认8:1
- -XX:NewRatio:老年代和年轻代的大小比值
- -XX:MaxTenuringThreshold:对象从年轻代晋升到老年代需要经历的GC次数的最大阈值
3.年轻代垃圾收集器
Serial收集器
使用-XX:+UseSerialGC设置年轻代使用此垃圾收集器,采用复制算法。单线程收集,在进行垃圾收集时必须暂停其他所有工作的线程,简单高效,JVM的Client模式下的默认垃圾收集器
ParNew收集器
使用-XX:+UseParNewGC设置年轻代使用此垃圾收集器,采用复制算法。多线程收集,进行垃圾收集时和Serial一样暂停其他工作线程,其在多核cpu的情况下才能发挥其优势
Parallel Scavenge收集器
使用-XX:+UseParallelGC设置年轻代使用此垃圾收集器,采用复制算法。与ParNew一样多线程收集,相比于前两者收集器关注点为垃圾收集停顿时间,此垃圾收集器的关注点为吞吐量(用户运行代码的时间/用户运行代码的时间+垃圾收集时间),多核cpu才能发挥优势,JVM的Server模式下的默认垃圾收集器
如果对其垃圾收集器的工作原理不太理解,常常使用此垃圾收集器配合-XX:+UseAdaptiveSizePolicy自适应调节策略,把内存调优任务交给JVM
4.老年代垃圾收集器
Serial Old收集器
使用-XX:+UseSerialOldGC设置老年代使用此垃圾收集器,采用标记-整理算法。其特点与Serial收集器的特点相同
Parallel Old收集器
使用-XX:+UseParallelGC设置老年代使用此垃圾收集器,采用标记-整理算法。其特点与Parallel Scavenge相同,多线程收集,吞吐量优先,常与Parallel Scavenge配合使用达到高吞吐量的效果
CMS收集器
使用-XX:+UseConcMarkSweepGC设置老年代使用此垃圾收集器,采用标记-清除算法。CMS是一种以获取最短停顿时间为目的的收集器,是垃圾收集和工作线程几乎可以并行工作的收集器(并发收集器)
G1收集器
使用-XX:+UseG1GC设置老年代使用此垃圾收集器,采用复制+标记-整理算法。它是一款并行并发收集器,对整个堆空间进行垃圾收集,能建立可预测的停顿时间模型
各个收集器之间的可兼容关系
图中上半部分为年轻代垃圾收集器,下半部分为老年代垃圾收集器,连线意味着可兼容