垃圾收集器所关注的部分是Java堆和方法区
GC需要解决的三件事情
那些内存需要回收?
什么时候回收?
如何回收?
确定堆里的那些对象是"存活",那些已经"死去"(即不可能再被任何途径使用的对象)。
存活判定算法
引用计数算法:
给对象中添加一个引用计数器,每当有一个地方引用它时,计数器就加1;当引用失效时,计算器值就减1;任何时刻计算器为0的对象就是不能再被使用的。
可达性分析算法
这个算法的基本思路就是通过一系列的称为“GC Roots”的对象作为启示点,从这些节点开始向下搜索,搜索所走过的路径称为引用链,当一个对象GC Roots没有任何引用链相连时,则证明对象是不可用的。
在Java语言中,可作为GC Roots的对象包括下面几种:
虚拟机栈(栈帧中的本地变量表)中引用的对象
方法区中类静态属性引用的对象
方法区中常量引用的对象
本地方法栈中JNI引用的对象
引用
在引用计数算法和可达性分析算法都涉及到引用的,判断对象的是否存活都与引用有关
在JDK1.2之后对引用作了概念上的扩充,引用分类强引用、软引用弱引用、虚引用四种。这四种引用强度依次减弱。
生成还是死亡
即使在可达性分析算法中不可达的对象,并非是非死不可的,这时候他们暂时处于缓刑阶段,真正宣告一个对象死亡,至少要经历两次标记过程:如果在进行可达性分析后发现没有与GC Roots 相连接的引用链,那它将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法,finalize是对小逃离死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模的标记,如果对象在finalize中成功拯救自己,只要重新与引用链上的任何一个对象建立关联即可,碧如把自己的this赋值给某个变量或者对象的成员变量,那在第二次标记时它将被移除出即将回收的集合,如果对象这个时候没有逃脱,那基本上它就真的被回收了。
回收方法区
方法区的垃圾收集主要回收两部分内容:废弃常量和无用的类。回收废弃常量与回收Java堆中的对象非常类似。以常量池中字面量的回收为例,假如一个字符串“ABC”已经进入 了常量池中,但是当前系统没有任何一个String对象是叫做“ABC”,换句话说,就是没有任何String对象引用常量池中的“ABC”常量,也没有其他地方引用了这个字面量,如果这时发生内存回收、而且必要的话,这个“ABC””’常量就会被系统清理出常量池。常量池中的其他类(接口)、方法、字段的符号引用也与此类似。
判断一个常量是否是废弃常量比较简单,而要判断一个类是否是无用的类的条件则相对苛刻许多,类需要同时满足下面3个条件才能算是无用的类
该类所有的实例都已经被回收,也就是Java堆中不存在该类的任何实例。
加载该类的ClassLoader已经被回收。
该类对应的java.lang.Class对象没有任何地方被引用,无法在任何地方通过反射访问该类的方法。
垃圾收集算法
标记-清除算法
最基础的收集算法是“标记-清除”算法,分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。后续的其他收集算法都是基于这种思路并对其不足进行改进而得到的。
主要的不足的两点
- 效率问题,标记和清除两个过程的效率都不高
-
空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片大多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提触发另一次垃圾收集动作。
复制算法
为了解决效率问题,一种称为“复制”的收集算法出现了,它将可用内存按容量划分为大小相等的两块,每次只是用其中的一块。当这一块的内存用完了,就将还存在活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。这样使得每次都是对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等复制情况,只要移动堆项指针,按顺序分配内存即可,实现简单,运行高效,只是这种算法的代价是将内存缩小为原来的一半,
新生代中的对象98%是“朝生夕死”的,所以并不需要按照1:1的比例来划分内存空间,而是将内存分为一块较大的Eden空间和两块较小的survivor空间,每次使用Eden和其中一块survivor,当回收时,会把Eden和survivor中还存获得对象复制到另一块survivor空间上,最后清理掉Eden和刚才用过的survivor空间。Eden和survivor的大小比例是8:1,也就是每次新生代中可用的内存空间为整个新生代容量的90%,只有100%的内存会被浪费。
标记-整理算法
复制收集算法在对象存活率较高时就要进行较多的复制操作,效率将会变低。更关键的是,如果不想浪费50%的空间,就需要有额外的空间进行分配担保,以应对被使用的内存中所有对象都100%存活的极端情况,所以在老年代一般不能直接选用这种算法。根据老年代的特点,有人提出了一种“标记-整理”算法,标记过程仍然与标记“标记-清除”算法一样,但是后续的步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。
分代收集算法
这种算法只是根据对象存活周期的不同将内存划分为几块,一般是把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用适当的手机算法。在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用“标记-清理”或者“标记-整理”算法来进行回收。