一、对象是否存活?
1.引用计数算法
定义:给对象添加一个引用计数器,有一个地方引用的时候,计数器值加1;当引用失效时,计数器值减1;任何时刻计数器值为0的对象就是为使用的对象。
优点:实现简单、效率高
缺点:使用较少,主流的Java虚拟机没有使用引用计数法来管理内存,主要原始时它很难解决对象之间互相循环引用的问题。
2.可达性分析算法
定义:通过一系列 “GC Roots” 的对象作为起始点,从这些节点开始向下搜索,搜索走过的路径称为引用链,当一个对象没有任何引用链相连时,则证明此对象时不可以用的。
优点:当前主流的商用程序语言的主流实现中都是使用可达性分析算法来判定对象是否存活的。
GC Roots:虚拟机栈中引用的对象
方法区中类静态属性引用的对象
方法区中常量引用的对象
本地方法栈中JNI引用的对象
3.引用
强引用:类似 “Object obj = new Object()“ ,只要强引用还存在,垃圾收集器就永远不会回收调被引用的对象。
软引用:还有用但是并非必需的对象。在系统将要发生内存溢出异常之前,会将这些对象放入到回收范围内进行第二次回收。
弱引用:用来描述非必需的对象,但是它的强度比软引用更弱一些。被弱引用关联的对象只能生存到下一次垃圾收集发生之前。
虚引用:最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为对象设置虚引用关联的唯一目的就是能够在这个对象被垃圾收集器回收的时候收到一个系统通知。
4.可达性分析不可达对象的处理
对于不可达对象,要宣判这个对象真正的死亡,至少需要两次标记过程。若对象没有与GC Roots相连接的引用链,则会被第一次标记并且接下来进行一次筛选,筛选条件时此对象是否有必要执行finalize()方法。当对象没有覆盖finalize()或该方法已经被虚拟机调用过,虚拟机将这两种情况视为“没有必要执行”。
若这个对象有必要执行finalize()方法,这个对象会被放置在F-Queue队列里面等待一个由虚拟机自动创建、低优先级的Finalizer线程去执行。如果对象在执行finalize()方法时,重新与引用链上的任何一个对象建立关联,那么这个对象就可以存活,不会被回收,否则就会被回收。
二、垃圾收集算法
1.标记—清除算法
定义:首先标记出所需要回收的对象,在标记完成后统一回收所标记的对象。
缺点:效率低、标记清除之后产生大量不连续的内存碎片,导致后续程序需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。
2.复制算法
定义:将内存按容量划分为大小相等的两块,每次只使用其中的一块。当一块内存用完了,就将海存活的对象复制到另一块上面,然后把已使用过的内存空间一次清理掉。
优点:实现简单、运行高效。
缺点:将内存缩小为原来的一半。
现在的商业虚拟机都采用这种收集算法来回收新生代,内存不需要按照1:1的比例来划分内存空间。可以将内存划分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块Survivor。回收时,将Eden和Survivor中还存活的对象一次性复制到另一块Survivor空间上,最后清理掉Eden和刚使用过的Survivor空间。HotSpot虚拟机默认Eden和Survivor的大小比例是8:1。当Survivor空间不够用是,需要依赖其他内存(老年代)进行分配担保。
3.标记—整理算法
定义:标记过程和“标记—清除”算法一样,后续让所有存活对象都向一端移动,然后直接清理掉端边界以外的内存。(在老年代中使用比较多)
4.分代收集算法
定义:将Java堆分为新生代和老年代,根据各个年代的特点采用最合适的收集算法。
三、垃圾收集器
简介:垃圾收集器算是内存回收的具体实现,Java虚拟机规范中对于垃圾收集器应该如何实现没有任何规定,因此不同的厂商、不同的版本的虚拟机提供的垃圾收集器可以会有很大的差别。
1.Serial 收集器
简介:Serial 收集器是最基本、发展历史最悠久的收集器(在JDK1.3.1之前这是虚拟机新生代收集的唯一选择)。这个收集器是一个单线程的收集器,在进行垃圾收集时,它只会使用一个CPU或一条收集线程去完成工作。在它进行垃圾收集时,必须暂停其他所有的工作线程,直到它收集结束。使用复制算法。
优点:简单高效(和其他收集器的单线程比)
缺点:硬件使用率低,有时停顿时间过长,给用户带来不良的体验
2.ParNew 收集器
简介:ParNew 收集器时Serial收集器的多线程版本,除了使用多线程进行垃圾收集之外,其余行为和Serial完全一致。这款收集器时HotSpot虚拟机中第一款真正意义上的并发收集器。使用复制算法。
优点:支持多线程进行垃圾回收行为,并且可以和老年代的垃圾收集器CMS配合工作。
3.Parallel Scavenge 收集器
简介:采用复制算法,并行的多线程收集器。这个收集器关注的是达到一个科控制的吞吐量。(吞吐量 = 运用用户代码时间/(运行用户代码时间+垃圾收集时间))其提供两个参数用户精确控制吞吐量,控制最大垃圾收集停顿时间的-XX:MaxGCPsuseMillis 以及 直接设置吞吐量大小的 -XX:GCTimeRatio 参数。
4.Serial Old 收集器
简介:Serial Old 是 Serial收集器的老年代版本,同样是一个单线程收集器,使用“标记—整理”算法。
5.Parallel Old 收集器
简介:Parallel Old 是Parallel Scavenge 收集器的老年代版本,使用多线程和“标记—整理”算法。(JDK 1.6 中才开始使用)
6.CMS 收集器
简介:CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。使用“标记—清除”算法实现,回收过程分为4个步骤。<u style="box-sizing: border-box;">初始标记、并发标记、重新标记、并发清除</u>。其中初始标记、重新标记这两个不走仍然需要“Stop The World”。初始标记仅仅是标记一下GC Roots 能直接关联到的对象,并发标记就是进行GC Roots Trancing的过程,而重新编辑则是为了修正并发标记期间因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录。这个阶段一般会比初始标记阶段稍长一些,但远比并发标记的时间段。
优点:并发收集、低停顿。
缺点:CMS 收集器对CPU资源非常敏感,CMS 收集器无法处理浮动垃圾(在并发清理时产生),会产生内存碎片(可以透过参数设置解决,但是会导致停顿时间变长)。
7.G1 收集器
简介:G1(Garbage—First)收集器是当今收集器技术发展的最前沿成果之一。是一款面向服务端应用的垃圾收集器。
特点:并行与并发、分代收集、空间整合、可预测的停顿
G1收集器的Java堆内存布局和其他收集器由很大的区别,它将整个Java堆划分为多个大小相等的独立区域(Region),虽然还有新生代和老年代的概念,不过新生代和老年代不再是物理隔离的,他们是Region的集合。G1之所以可以建立可预测的停顿,是因为它可以有计划的避免在整个Java堆中进行全区域的垃圾收集。G1跟踪各个Region里面的垃圾堆的价值大小,在后台维护一个优先列表,在有限的收集时间内,首先收集回收价值大的Region。
G1收集器运作大致可分为4个步骤,初始标记、并发标记、最终标记、筛选回收。
四、内存分配与回收策略
1.对象优先在Eden分配
大多数情况下,对象在新生代Eden区中分配。当Eden区没有足够空间进行分配时,虚拟机将发起一次Minor GC。
2.大对象直接进入老年代
典型的大对象时那种很长的字符串以及数组。
3.长期存活的对象将进入老年代
虚拟机给每个对象定义了一个对象年龄(Age)计数器,如果对象在Eden出生并经过第一次Minor GC后仍然存活,并且能被Survivor容纳,将被移动到Survivor空间,并且对象年龄设为1.对象在Survivor区中每熬过一次Minor GC,年龄就增加1岁,当它的年龄增加到一定程度(默认15岁),将会被晋升到老年代。对象晋升老年代的年龄阈值,可以通过参数-XX:MaxTeuringThreshold设置。
4.动态对象年龄判定
为了更好适应不同程序的内存情况,虚拟机并不是永远要求对象的年龄必须打掉MaxTenuringThreshold才能晋升老年代,如果在Survivor空间中同年龄所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象就可以直接进入老年代,无需等到dMaxTenuringThreshold中要求的年龄。
5.空间分配担保
在发生Minor GC 之前,虚拟机会先检查老年代最大可用的连续空间是否大于新生代所有对象总空间,如果这个条件成立,那么Minor GC 可以确保时安全的。如果不成立,则虚拟机会查看HandlePromotionFailure设置值是否允许担保失败,如果允许,那么会继续检查老年代最大可用连续空间是否大于历次晋升到老年代对象的平均大小,如果大于,将尝试着进行一次Minor GC,尽管这次Minor GC 是由风险的;如果小于,或者handlePromotionFailure设置不允许冒险,那这时改为进行一次Full GC。
小结:本文内容主要介绍几种JVM垃圾回收算法、垃圾收集器以及JVM中内存的管理。是JVM非常核心的内容,对系统的性能、并发等等有重要的影响。选择合适的最优的收集方式来获取最高的性能,读者可以通过内存分析工具来学习JVM调优,来实现系统的性能提升和优化。本文若有错误之处,欢迎指正!