一、垃圾收集器判断对象已死的算法
1.对象已死吗?
判断方法有以下两种:
-
1.引用计数法
给对象添加一个引用计数器,每当有一个地方引用它时,计数器就加1;当引用失效时,计数器数值就减1;任何时刻计数器为0的对象就是不可能再被使用的。
但是这种方法有个弊端:很难解决对象之间相互循环引用的问题。 -
2.可达性分析算法
当一个对象到 GC Roots 没有任何引用链相连(用图论的话来说就是从 GC Roots 到这个对象不可达时),证明这个对象是不可用的。
-
3.四种引用类型
强引用:
Object obj = new Object()
,这就是强引用。只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象。软引用:软引用用来描述一些还有用但并非必需的对象。对于软引用关联的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中进行第二次回收。如果这次回收还没有足够的内存,才会抛出内存溢出异常。使用
SoftRefrence类
实现软引用。弱引用:弱引用也是用来描述非必须对象的,但是强度比软引用更弱。被弱引用关联的对象只能生存到下一次垃圾回收之前。垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。使用
WeakRefrence类
实现弱引用。虚引用:这是最弱的一种引用关系。对象的生存时间与虚引用完全没有关系,无法通过虚引用获得对象实例。虚引用的唯一作用就是在对象被垃圾回收时收到一个系统通知。使用
PhantomRefrence类
实现虚引用。
二、垃圾收集算法
-
1.标记-清除算法(
Mark-Sweep
)最基础的收集算法是“标记-清除算法”。这个算法分为两个阶段:标记和清除。
标记:在标记阶段,collector
从mutator根
对象开始进行遍历,对从mutator根
对象可以访问到的对象都打上一个标识,一般是在对象的header
中,将其记录为可达对象。
清除:在清除阶段,collector
对堆内存(heap memory)
从头到尾进行线性的遍历,通过读取对象的 header
信息,如果发现某个对象没有标记为可达对象,则就将其回收。标记为可达对象的对象,将重新去掉 header
信息的标志位,以准备下次垃圾回收。
但是这种方法有2个不足:
1.效率问题,标记和清除两个过程效率都不高。
2.空间问题,标记清除之后会产生大量的不连续的内存碎片,空 间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾回收动作。
-
2.复制算法 (Copying)
复制算法将内存划分为两个区间,在任意时间点,所有动态分配的对象都只能分配在其中一个区间(称为活动区间),而另外一个区间(称为空闲区间)则是空闲的。
当有效内存空间耗尽时,JVM 将暂停程序运行,开启复制算法 GC 线程。接下来 GC 线程会将活动区间内的存活对象,全部复制到空闲区间,且严格按照内存地址依次排列,与此同时,GC线程将更新存活对象的内存引用地址指向新的内存地址。
而此时,其实空闲区间和活动区间已经进行了交换,垃圾对象已经全部留在了原来的活动区间,也就是现在的空闲区间。事实上,在活动区间转换为空间区间的同时,垃圾对象已经被一次性全部回收。
优点:每次内存回收都是对整个半区进行内存回收,内存分配时不用考虑内存碎片的问题,只要移动堆顶指针,按照顺序分配内存即可,实现简单,运行高效。
缺点:1.代价是将内存缩小为原来的一半;2.如果对象的存活率很高,我们可以极端一点,假设是100%存活,那么我们需要将所有对象都复制一遍,并将所有引用地址重置一遍。复制这一工作所花费的时间,在对象存活率达到一定程度时,将会变的不可忽视。
复制算法比较适合的场景:对象的存活率要非常低才行,而且最重要的是,我们必须要克服50%内存的浪费。
下面看看复制算法回收前和回收后的内存模型:
回收前:
回收后:
由于 1,4 对象不可达,被回收掉,剩下的对象按照顺序分配内存。这时右边的区域变成了活动区间,左边变成空闲区间,下次垃圾回收将再次调换回来。
-
3.标记-整理算法 (Mark-Compact)
标记-整理算法与标记-清除算法非常相似,它也是分为两个阶段:标记和整理。
标记:它的第一个阶段与标记-清除算法是一模一样的,均是遍历 GC Roots,然后将存活的对象标记。
整理:移动所有存活的对象,且按照内存地址次序依次排列,然后将末端内存地址以后的内存全部回收。因此,第二阶段才称为整理阶段。
标记-整理算法 GC 前后的图示与复制算法的图非常相似,只是没有了活动区间和空闲区间的区别,而过程又与标记-清除算法非常相似。
回收前
标记
标记为 1 表示对象仍然可达。
整理
可见,1,4 对象被回收了,剩下的存活对象的内存按照顺序排列,这点很像复制算法,回收后不存在内存碎片问题,而且避免了内存减半的高额代价。但是处理过程又想标记-清除算法,不仅要标记所有存活对象,还要整理所有存活对象的引用地址。效率也不高,在效率上要低于复制算法。
参考资料