上一章我们介绍了Java内存区域的作用,其中程序计数器、虚拟机栈、本地方法栈3个区域随线程而生,随线程而灭,栈中的栈帧随着方法的进入与退出有条不紊的执行着出栈和入栈的操作。其中每一个栈帧中分配多少内存已经在类结构确定下来时就已知了。所以这几个区域内就不需要过多考虑回收的问题,因为方法结束或者线程结束时,内存自然就回收了。
所以垃圾收集器关注就是Java堆和方法区的内存。
因为我们只有在程序运行期间才能知道会创建哪些对象,这部分内存的分配和回收都是动态的。
如何判断对象是否需要收集?
堆中存放着几乎所有的对象的实例。如何判断是垃圾收集器的首要任务。
1.引用计数算法
这也是大家都了解的算法:给对象添加一个引用计数器,每当有一个地方引用它的时候,计数器值就+1,当引用失效就-1,任何时刻计数器为0的对象就是不可能在被使用的。
客观的说这十个不错的算法,实现简单而且判定效率高,但是至少主流的Java虚拟机里面没有选用这个算法管理内存,因为它很难解决对象之间相互循环引用的问题。
运行结果证明,虚拟机并没有因为这两个对象互相引用就不回收他们,这也从侧面分析出Java虚拟机并没有应用引用计数算法。
2.可达性分析算法
这个算法的基本思想就是通过一系列的成为“GC Roots”的对象左右起始点,从这些节点开始向下搜索,搜索所有过的路径称为引用链,当一个对象到GC Roots没有任何引用链相连时,则证明这个对象时不可用的,被判定为可回收对象。
在Java中,可作为GC Roots的对象包括以下几种
1.虚拟机栈中引用的对象。
2.方法区中类静态属性引用的对象。
3.方法区中常量引用的对象。
4.本地方法栈中本地方法引用的对象。
2.1 生存还是死亡
即使在可达性分析算法中不可达的对象,也并非是非死不可的。这时候只是进入了“缓刑”阶段,要宣告回收一个对象,至少要经历两次标记过程
1.对象进行可达性分析后发现没有与GC Roots相连接的引用链,它会被标记并进行一次筛选。
2.筛选的条件是此对象是否有必要执行 finalize() 的方法(当对象没有覆盖 finalize() 方法或者该方法已经被虚拟机调用过,则虚拟机认为这两种情况都是“没有必要执行”)
3.如果有必要执行,该对象就会被放置在F-Queue队列中,并在稍后由一个虚拟机自动建立的、低优先级的Finalizer线程去执行。
4.(finalize() 方法是对象逃脱的最后一次机会。)稍后GC将对F-Queue中的对象进行第二次小规模标记,如果对象要拯救自己---------只要重新与引用链上的任何一个对象建立关联即可。在第二次标记时就会把它移除“即将回收”的集合。
3.垃圾收集算法
3.1 标记-清除算法
最基础的收集算法就是“标记-清除算法”,分为两个阶段:首先标记处所有需要回收的对象,在标记完成后统一回收所有被标记的对象。
之所以说它是最基础的算法,是因为后续的收集算法都是基于这种思路并对其不足进行改进而得到的。
它有两个不足:一个是效率问题,一个是空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后过程中需要分配大对象时,无法找到足够的连续内存而不得不提前触发领一次垃圾收集动作。
3.2 复制算法
为了解决效率问题,出现了“复制”算法,它可将可用内存按容量划分为大小相等的两块,每次只使用一块,当这一块的内存用完了,就将还存活着的对象复制到另一块上面,再把已经使用过的内存空间一次清理掉,这样使得每次只对一半的区域进行内存回收。
优点:实现简单、运行高效,不需要考虑内存碎片等复杂情况。
缺点:代价是将内存缩小为了原来的一半,代价有点高:(
现在的商业虚拟机都采用这种方法来回收新生代,将内存分为一块较大的 Eden 空间和两块较小的 Survivor 空间,每次使用 Eden 和其中一块 Survivor 。当回收时,将 Eden 和 Survivor 中还存活着的对象一次性地复制到另外一块 Survivor 空间上,最后清理掉 Eden 和刚才用过的 Survivor 空间。(如果Survivor空间不够用时,需要依赖其他内存(老年代)进行分配担保)。
3.3 标记-整理算法
根据老年代的特点,提出了“标记-整理”算法,标记过程仍然与“标记-清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。
4.内存分配与回收策略
对象的内存分配,往大方向讲,就是在堆上分配,对象主要分配在新生代的 Eden 区上。
4.1 对象优先在 Eden 分配
大多数情况下,对象在新生代 Eden 区中分配、当 Eden 区没有足够空间进行分配时,虚拟机将发起一次 Minor GC。
Minor GC(新生代GC):指发生在新生代的垃圾收集动作,因为Java对象大多都具备朝生夕灭的特性,所以Minor GC非常频繁,一般回収速度也比较快。
Major GC/Full GC(老年代GC):指发生在老年代的GC,出现了Major GC,经常会伴随至少一次的Major GC。Major GC的速度一般会比Minor GC慢10倍以上。
4.2 大对象直接进入老年代
所谓的大对象是指,需要大量连续内存空间的Java对象,最典型的大对象就是那种很长的字符串以及数组。大对象对虚拟机分配来说就是一个坏消息,经常出现大对象会容易导致内存还有不少空间时就提前触发垃圾收集以获取足够的空间来“安置”它们。
4.3 长期存活的对象将进入老年代
既然虚拟机采用了分代收集的思想来管理内存,那么内存回收时就必须能识别哪些对象应放在新生代,哪些放在老年代中。为了做到这一点,虚拟机给每个对象定义了一个对象年龄(Age)。如果对象在Eden曲出生并警告过第一次MinorGC后仍然存活,并且能够被Survivor容纳的话,将被移动到Survivor空间中,并且对象年龄设为1。每熬过一次MinorGC,年龄就增加一岁,当年龄到一定程度时(默认为15),就会晋升到老年代中。
摘自《深入理解Java虚拟机》第二版