可回收对象判定算法
可回收对象的判定算法,即判断哪些对象是可以被回收,目前主流的语言一般有以下两种:
(1)引用记数算法
(2)可达性分析算法
引用记数算法:
给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就减1;任何时刻计数器为0的对象就是不可能再被使用的。如下图:
说到JVM怎么判断一个对象是不是可回收的,可能大部分人都知道这种引用记数算法。其实不然,主流的Java虚拟机并没采用这种方式。虽然这种算法的效率很高,在发部分情况下是中不错的选择,却存在巨大的缺陷 -- 循环引用问题。
比方说有两个对象A和B,A引用了B,B又引用了A,除此之外没有别的对象引用A和B,那么A和B在我们看来已经是垃圾对象,需要被回收,但它们的引用计数不为0,没有达到回收的条件。如图:
正因为这个循环引用的问题,Java并没有采用引用计数法。
那么有没有什么好的办法去解决这个缺陷呢?话说iOS的同学使用的Objective-C其实就是使用这种方式判定垃圾对象的,不过Objective-C是通过在语言层面进行控制:比如在引用的时候通过关键字“Strong”和“Weak”来区别不同的引用类型,当使用“Strong”来引用对象时,对象的引用计数器会+1 ,当使用“Weak”时,引用计数器不增加。当要使用循环引用时,只需要将其中一个对象的引用声明成“Weak”就可以打破循环了。
可达性分析算法:
在目前几乎所有的Java虚拟机中,都采用这种可达性分析算法。通过一系列的称为“GC Roots”的对象作为起始点,从这些节点开始进行向下搜索,搜索所走过的路径成为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连(用图论的话来说就是从GC Roots到这个对象不可达)时,则证明此对象是不可用的。
可以作为GC Roots的对象有:
- 在虚拟机栈(栈帧中的本地变量表)中的引用的对象。
- 在方法区中的类静态属性引用的对象(静态变量)。
- 在方法区中的常量引用的对象。
- 在本地方法栈中JNI(即一般说的Native方法)的引用的对象。
垃圾收集算法
- 标记-清除算法
- 复制算法
- 标记-整理算法
- 分代收集算法
标记-清除算法:
算法分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收掉所有被标记的对象。
标记-清除算法的主要缺陷:标记清除之后会产生大量不连续的内存碎片。也就是说会产生大量的不连续内存,在要存入大对象且内存不足时会再次触发GC。
这是垃圾回收算法中最基本的算法,简单粗暴,后面的几种其他算法都是基于标记-清除算法实现的。
复制算法:
复制算法基本原理:将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象一个个的复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。这样一次对于整片大范围回收,效率更高。同时不用考虑碎片问题(已经整理好,内存连续)。
复制算法的主要缺陷:
①将内存缩小为了原来的一半。
②如果在对象存活率较高的情况下,需要进行较多的复制操作,收集效率就会下降。
现在主流商用虚拟机都使用这种复制算法来对新生代进行回收。根据IBM的研究,新生代高达98%的对象都是朝生夕死的,并不适合1:1的方式划分内存。因此通常会把堆空间划分为一块较大可用空间和两块较小的拯救空间,每次使用较大的可用空间和一块较小的拯救空间。当发生GC时,每次将存活对象复制到剩余的那块拯救空间上,其余的全部回收即可。
HotSpot使用的可用空间与拯救空间的比例是 8:1,也就是说每次使用的新生代空间是90%, 只会存在10%的剩余空间。当然,再极端情况下并不能保证存活的对象只占堆空间的10%,因此当剩下的那块拯救空间不够用时,需要依赖其他的内存空间,比如 老年代 来进行空间担保。就像我们去银行贷款,如果我们的每次都按时还款,信誉非常良好,那么银行就会认为我们下一次也能按时还款,只需要一个担保人去担保,万一出现不能按时还款的情况,那么就会从担保人的账户里直接扣款。同理,如果最后一块拯救空间不足以存放GC后的剩余对象,那么老年代就会承担空间担保的角色,让其他无法存放的对象暂时存放在 老年代。
标记-整理算法:
复制算法 主要用于解决 标记-清除算法中效率不高的问题,而接下来的标记整理算法则主要是用来解决 标记-清除算法中空间碎片的问题。另外,复制算法如果在对象存活率较高的情况下,需要进行较多的复制操作,收集效率就会下降。更关键的是,如果连担保空间都不够了怎么办?因此在存活对象较多的情况下,就不会采用复制算法,Java堆中的 老年代就非常符合这种情况,于是就有了这个 标记-整理算法。
标记-整理算法 基本原理:标记-整理算法 其实是 标记-清除算法的一种扩展,标记过程仍然与 标记-清除算法 一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。
标记-整理算法的主要缺陷:标记和整理阶段必须停止执行线程。
当所有可回收对象(红色)被清楚后,将存活对象全部向一端移动,之后虚GC将存活对象边界之外的空间一次性全部清理掉,这样就解决了碎片化问题。但是缺点也很明显,相对于标记清除算法对于系统的停顿时间会更长。无论是标记阶段 还是整理阶段都需要停止所有执行线程,对一个静止的虚拟机堆快照进行收集。
分代收集算法:
分代收集算法基本原理:根据对象的存活周期的不同将内存划分为几块。一般是把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。
分代收集算法是目前商用虚拟机共用的垃圾收集算法,它没有特定的算法,都是根据不同的块进行不同的算法。 就像之前提到的,新生代采用复制算法 ,老年代采用 标记整理算法 。在新生代中,每次都有大量的对象死去,只有少量的对象存活,适合使用复制算法,只需要少量的对象复制成本就可以完成垃圾收集,在老年代中,对象存活比例较高,也没有额外的空间进行担保,就需要使用 标记-清理 或 标记-整理算法