什么地方需要回收
在Java的堆区和方法区,这部分的内存分配都是动态的,我们只有在运行期间才能知道会创建哪些对象。垃圾回收器关注的就是这部分的内容。关于Java运行时各部分的分区,大家可以查看这篇文章。深入理解JVM(1) : Java内存区域划分
什么时候回收
当一个对象实例不可能再被任何途径使用时。判断方法:
引用计数法算法:给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值加一,当某个引用失效时,计数器减一,任意时刻计数器为0的对象就是不能再被使用的。缺点是无法解决互相引用的问题。比如,对象A和对象B都有字段instance,赋值令A.instance = B.instance,除此之外,这两个对象再无其他任何引用,实际上这两个对象已经不可能再被访问,但是因为他们互相引用着对方,导致他们的引用计数都不为0,引用计数法也就无法通知垃圾回收器回收他们。
可达性分析算法:通过一系列称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链,当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的。如下图,对象object 5、object 6和object 7虽然互相有关联,但是他们到GC Roots是不可达的,所以他们将会被判定为是可回收对象。
在Java中可作为GC Roots的对象包括下面几种:
虚拟机栈中引用的对象;方法区中类静态属性引用的对象;方法区中常量引用的对象;本地方法栈中JNI(即一般说的Native方法)引用的对象。因为JVM认为他们是在被使用的,所以可以作为GC Roots。
当一个对象被标记为不可达时,如果这个对象被判定为有必要执行finalize()方法,只要他能在finalize()方法中成功让自己和任意一个引用链上的对象建立联系,他就可以不被回收。但是,由于虚拟机并不保证会等待这个方法运行,不确定性太大。所以不建议使用该方法,甚至你可以忘掉Java里有这个方法。
怎么回收
标记-清除算法
首先标记出需要回收的对象,在标记完成之后统一进行回收,标记过程和可达性判断相同。缺点有两个:一个是效率问题,标记和清除两个过程的效率都不高;还有空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行的过程中需要分配比较大的对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。
复制算法
将可用内存划分为大小相等的两块,每次只使用其中一块。当这一块的内存用完了,就将这块内存上海存活的对象复制到另外一块上,然后再将该内存空间一次全部清理掉。现在大部分商业虚拟机采用的都是这种收集算法来回收新生代,只不过不是按照1:1的比例进行划分。
标记-整理算法
和标记-清除算法类似,首先对需要回收的对象进行标记,但是之后的步骤不是直接对可回收对象进行操作,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。
分代回收算法
这种算法是上面几种算法的结合。根据对象存活周期的不同,将内存划分为几块,然后在根据划分的区域选择不同的算法。一般Java把堆分为新生代和老年代。在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,所以选择复制算法,只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高。没有额外的空间对它进行分配担保,就必须使用“标记-清除”或者“标记-整理”算法来进行回收。
新生代中,又将内存分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块Survivor。当回收是,将Eden和Survivor中还存活的对象一次性复制到另外一块Survivor空间上,最后清理掉Eden和刚才使用过的Survivor。