JVM架构
当一个程序启动之前,它的class会被类装载器装入方法区(Permanent区),执行引擎读取方法区的字节码自适应解析,边解析边运行,然后pc寄存器指向了main函数所在位置,虚拟机开始为main函数在Java栈中预留一个栈帧(每个方法都对应一个栈帧),然后开始跑main函数,main函数里的代码被执行引擎映射成本地操作系统里相应的实现,然后调用本地方法接口,本地方法运行的时候,操纵系统会为本地方法分配本地方法栈,用来储存一些临时变量,然后运行本地方法,调用操作系统API。
执行引擎中的GC(垃圾收集器)主要作用域运行时数据区的方法区和堆。
一些概念
通用GC概念
垃圾:Garbage(名词),在系统运行过程当中所产生的一些无用的对象,这些对象占据着一定的内存空间,如果长期不被释放,可能导致OOM。
垃圾收集器:Garbage Collector(名词),负责回收垃圾对象的垃圾收集器
垃圾回收:Garbage Collect(动词),垃圾收集器工作时,对垃圾进行回收
垃圾回收算法/GC算法:不同的GC算法,它们的垃圾回收工作模式不同(比如串行、并行等)
引用计数算法(Reference Counting)
标记-清除算法(Mark-Sweep)
复制算法(Copy)
标记-整理算法(Mark-Compact)
标记-清除-整理算法(Mark-Sweep-Compact)
GC算法优点缺点存活对象移动内存碎片适用场景
引用计数实现简单不能处理循环引用
标记清除不需要额外空间两次扫描,耗时严重NY旧生代
复制没有标记和清除需要额外空间YN新生代
标记整理没有内存碎片需要移动对象的成本YN旧生代
这几种算法中存活对象没有移动的算法只有:标记-清除算法。复制算法会将存活对象移动到另一块内存区,标记整理算法会将存活对象移动到边界位置
垃圾回收线程/GC线程:垃圾收集器工作时的线程。
应用程序和GC都是一种线程,以Java的main方法为例:应用程序的线程指的是main方法的主线程,GC线程是JVM的内部线程。
在GC过程中,如果GC线程必须暂停应用程序线程(用户线程),则发生Stop the World。当然也可以允许GC线程和应用程序线程一起运行,即GC并不会暂停应用程序的线程。
串行、并行、并发:串行和并行指的是垃圾收集器工作时暂停应用程序(发生Stop the World),使用单核CPU(串行)还是多核CPU(并行)。
串行(Serial):使用单核CPU串行地进行垃圾收集
并行(Parallel):使用多CPU并行地进行垃圾收集,并行是GC线程有多个,但在运行GC线程时,用户线程是阻塞的
并发(Concurrent):垃圾收集时不会暂停应用程序线程,大部分阶段用户线程和GC线程都在运行,我们称垃圾收集器和应用程序是并发运行的。
概念Stop the World单线程/多线程
串行YGC线程是单线程
并行YGC线程是多线程
并发NGC线程和应用程序线程是多线程
在Java中有并发编程的概念,并发编程中有多线程的概念。通常并发指的是不同类型的线程可以同时运行(比如GC线程和用户线程并发地运行),而并行指的是相同类型的线程采用多线程模式运行(比如GC线程使用多个CPU并行地运行)。
GC暂停/Stop The World/STW:不管选择哪种GC算法,Stop-the-world都是不可避免的。Stop-the-world意味着从应用中停下来并进入到GC执行过程中去。一旦Stop-the-world发生,除了GC所需的线程外,其他线程都将停止工作,中断了的线程直到GC任务结束才继续它们的任务。GC调优通常就是为了改善stop-the-world的时间(尽量减少STW对应用程序造成的暂停时间)。
垃圾对象:对象如果没有在使用,认为是垃圾对象,那么怎么判定有没有在使用?
一个在使用的对象(被引用的对象):程序的某个部分依然维系者一个指向该对象的指针
一个没有使用的对象(未被引用的对象):该对象不再被你程序的任何部分引用,所以被这些不再使用的对象占用的内存可以(被垃圾收集器)得到回收
具体的实现方式:
引用计数算法:对象的引用计数=0,表示没有对象引用它,可以作为垃圾对象(该方法无法处理循环引用)
根搜索算法:当前对象到根对象没有一条可达的路径,可以作为垃圾对象(JVM采用此方法)
引用计数算法和根搜索算法
引用计数
引用计数算法:每个对象都有一个引用计数器,当有对象引用它时,计数器+1;当引用失效时,计数器-1;任何时刻计数器为0时就是不可能再被使用的。
下图中左图是对象的引用关系,中图有一个引用失效,右图是清理引用计数器=0的对象后。
但是这种方式的缺点是:
引用和去引用伴随加法和减法,影响性能
对于循环引用的对象无法进行回收
下面的3个图中,最右图三个对象的循环引用的计数器都不为0,但是他们对于根对象都已经不可达了,但是无法释放。
根搜索
解决循环引用的办法是:使用根搜索算法来判定对象是否需要被回收,只要对象没有一条到根对象的可达路径,就可以被回收。
所以问题转换为:怎么定义根对象?在Java中可以作为GC Roots的对象:
虚拟机栈(左上)的栈帧的局部变量表所引用的对象
本地方法栈(右中)的JNI所引用的对象
方法区(右下)的静态变量和常量所引用的对象
示例
循环引用的程序实例,如果采用引用计数,无法被垃圾收集器回收
使用根搜索算法,则可以正常回收
Tracing GC算法
Tracing GC算法主要包括:
标记清理/标记清除:标记垃圾对象,然后清理垃圾对象
复制算法:标记垃圾对象和非垃圾对象,将非垃圾对象移动到某个空闲的内存块
标记压缩/标记整理:标记垃圾对象和非垃圾对象,将非垃圾对象移动在一起
通常还会存在标记清理和标记压缩结合起来的:标记-清理-压缩算法
结合根搜索算法定义的对象可达性,对应的垃圾收集算法如下(左图是垃圾收集前,右图是垃圾收集后):
A.标记-清理算法(Mark-Sweep Collector)
步骤:
标记阶段:根据可达性分析对不可达对象进行标记,即标记出所有需要被回收的对象
清理阶段:标记完成后统一清理这些对象,即回收被标记的对象所占用的空间
缺点:
标记和清理的效率都不算高(因为垃圾对象比较少,大部分对象都不是垃圾)
会产生大量的内存碎片,碎片太多可能会导致后续过程中需要为大对象分配空间时无法找到足够的空间而提前触发新的一次垃圾收集动作
适用场景:基于Mark-Sweep的GC多用于老年代。
B.复制算法(Copy Collector)
适用场景:新生代GC
C.标记-压缩算法(Mark-Compact Collector)
步骤:在完成标记之后,它不是直接清理可回收对象,而是将存活对象都向一端移动,然后清理掉端边界以外的内存
在标记好待回收对象后,将存活的对象移至一端
然后对剩余的部分进行回收
优点:
可以解决内存碎片的问题
适用场景:基于Mark-Compact的GC多用于老年代
D.标记-清理-压缩算法(Mark-Sweep-Compact Collector)
结合使用标记清理算法(Mark-Sweep)和标记压缩算法(Mark-Compact)
并不是每次标记清理都会执行压缩,而是多次执行GC后,才会执行一次Compact
优点:
相对于标记清理和标记压缩算法,可以减少移动对象的成本(并不是说不会移动对象,只要有压缩就一定会移动对象,只不过压缩不是很频繁)
JVM GC
前面我们分析了垃圾收集器的几种算法,在Java中,因为对象创建在堆中,垃圾收集时,垃圾收集器就应该扫描堆中的对象,执行垃圾收集工作。
基于分代理论的垃圾回收
JVM的垃圾回收器基于以下两个假设:
大多数对象很快就会变得不可达,即很多对象的生存时间都很短
只有极少数情况会出现旧对象(老年代对象)持有新对象(新生代)的引用,即新生对象很少引用生存时间长的对象
问题1:到底是老年代对象引用新生代对象,还是新生代对象引用老年代对象?
问题2:引用和持有引用有什么关系,比如A引用了B,和A持有B的引用。
这两条假设被称为”弱分代假设”。为了证明此假设,在HotSpot VM中物理内存空间被划分为两部分:新生代(Young generation)和老年代(Old generation)。
新生代:大部分新创建的对象分配在新生代。因为大部分对象很快就会变得不可达,所以它们被分配在新生代,然后消失不再。当对象从新生代移除时,我们称之为”Minor GC”。
老年代:在新生代中存活的对象达到一定年龄阈值时会被复制到老年代。一般来说老年代的内存空间比新生代大,所以在老年代GC发生的频率较新生代低一些。当对象从老年代被移除时,我们称之为”Major GC”(或者Full GC)。
概念
分代:将JVM的堆内存分成多个代(generation)。
新生代/年轻代:Java对象存活周期短命的对象放在新生代
由Eden、两块相同大小的Survivor区构成,to总为空
一般在Eden分配对象,优化:ThreadLocalAllocationBuffer
保存80%-90%生命周期较短的对象,GC频率高,采用效率较高的复制算法
旧生代/老年代/年老代:Java对象存活周期长命的对象放在老年代
存放新生代中经历多次GC仍然存活的对象
新建的对象也有可能直接在旧生代分配,取决于具体GC的实现
GC频率相对降低,标记(mark)、清理(sweep)、压缩(compaction)算法的各种结合和优化
Minor GC/Majar GC/Full GC
Minor GC 清理的是新生代空间,因此也叫做新生代GC
Major GC 清理的是老年代的空间,因此也叫做老年代GC
Full GC 清理的是整个堆:包括新生代、老年代空间
JVM的分代回收算法:根据不同代的特点采取最适合的收集算法,老年代的特点是每次垃圾收集时只有少量对象需要被回收,新生代的特点是每次垃圾回收时都有大量的对象需要被回收。
新生代:由于新生代产生很多临时对象,大量对象需要进行回收,所以采用复制算法是最高效的:存活对象少,回收对象多
老年代:回收的对象很少,都是经过几次标记后都不是可回收的状态转移到老年代的,所以仅有少量对象需要回收,故采用标记清除或者标记整理算法:存活对象多,回收对象少
不同代的GC算法选择:把Java堆分为新生代和老年代:短命对象归为新生代,长命对象归为老年代。
少量对象存活,适合复制算法:在新生代中,每次GC时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成GC。
大量对象存活,适合用标记-清理/标记-整理:在老年代中,因为对象存活率高、没有额外空间对他进行分配担保,就必须使用“标记-清理”/“标记-整理”算法进行GC。
新生代和老年代使用不同的GC算法(不同区中对象的存活特性不同),基于大多数新生对象都会在GC中被收回,新生代的GC使用复制算法
对象一般出生在Eden区,年轻代GC过程中,对象在2个幸存区之间移动,如果幸存区中的对象存活到适当的年龄,会被移动(提升)到老年代。
当对象在老年代死亡时,就需要更高级别的GC,更重量级的GC算法,复制算法不适用于老年代,因为没有多余的空间用于复制
Q&A
GC需要完成的事情:
哪些内存需要回收?
什么时候回收?
如何回收?
JVM内存区域中的程序计数器、虚拟机栈、本地方法栈这3个区域随着线程而生,线程而灭;栈中的栈帧随着方法的进入和退出而有条不紊地执行着出栈和入栈的操作,每个栈帧中分配多少内存基本是在类结构确定下来时就已知的。在这几个区域不需要过多考虑回收的问题,因为方法结束或者线程结束时,内存自然就跟着回收了。
而Java堆和方法区则不同,一个接口中的多个实现类需要的内存可能不同,一个方法中的多个分支需要的内存也可能不一样,我们只有在程序处于运行期间时才能知道会创建哪些对象,这部分内存的分配和回收都是动态的,GC关注的也是这部分内存。
Java的内存管理:Java的内存管理实际上就是对象的管理,其中包括对象的分配和释放。分配对象使用new关键字;释放对象时,只要将对象所有引用赋值为null,让程序不能够再访问到这个对象,我们称该对象为”不可达的”,GC将负责回收所有”不可达”对象的内存空间。
对于GC来说,当程序员创建对象时,GC就开始监控这个对象的地址、大小以及使用情况。通常,GC采用有向图的方式记录和管理堆中的所有对象。通过这种方式确定哪些对象是”可达的”,哪些对象是”不可达的”。当GC确定一些对象为”不可达”时,GC就有责任回收这些内存空间。
为什么需要GC?:忘记或者错误的内存回收会导致程序或系统的不稳定甚至崩溃,Java语言没有提供释放已分配内存的显示操作方法,但是Java提供的GC功能可以自动监测对象是否超过作用域从而达到自动回收内存的目的。在使用Java时,不需要在程序代码中显式地释放内存空间,垃圾回收器会帮你找到不再需要的(垃圾)对象并把他们移出。
为什么GC时需要暂停应用程序?:垃圾回收的时候,需要整个堆的引用状态保持不变,否则判定是垃圾,等稍后回收的时候它又被引用了,这就全乱套了。所以GC的时候,其他所有的程序执行处于暂停状态,卡住了。幸运的是,这个卡顿是非常短(尤其是新生代),对程序的影响微乎其微,所以GC的卡顿问题由此而来,也是情有可原,暂时无可避免。
以引用计数的方式回收垃圾对象为例,应用程序的线程需要被暂停才能完成回收,因为如果引用状态一直在变的话,垃圾收集器就无法准确地计数(统计对象的引用次数)。垃圾回收时要保证内存中所有对象的引用状态不变,所以GC时其他所有的程序处于暂停状态。
增量式GC和普通GC的区别:GC在JVM中通常是由一个或一组进程来实现的,它本身也和用户程序一样占用heap空间,运行时也占用CPU。当GC进程运行时,应用程序停止运行。如果GC运行时间较长时,用户能够感到Java程序的停顿(超时);如果GC运行时间太短,则可能对象回收率太低,这意味着还有很多应该回收的对象没有被回收,仍然占用大量内存。因此在设计GC的时候,就必须在停顿时间和回收率之间进行权衡。
增量式GC:通过一定的回收算法,把一个长时间的中断,划分为很多个小的中断,通过这种方式减少GC对用户程序的影响。虽然增量式GC在整体性能上可能不如普通GC的效率高,但是它能够减少程序的最长停顿时间。增量式GC的实现采用TrainGC算法,它的基本想法是:将堆中的所有对象按照创建和使用情况进行分组(分层),将使用频繁高和具有相关性的对象放在一队中,随着程序的运行,不断对组进行调整。当GC运行时,它总是先回收最老的(最近很少访问的)的对象,如果整组都为可回收对象,GC将整组回收。这样,每次GC运行只回收一定比例的不可达对象,保证程序的顺畅运行。
为什么要分代:分代的垃圾回收策略,是基于这样一个事实:不同对象的生命周期是不一样的。因此,不同生命周期的对象可以采取不同的收集方式,以便提高回收效率。在Java程序运行的过程中,会产生大量的对象,其中有些对象是与业务信息相关,比如Http请求中的Session对象、线程、Socket连接,这类对象跟业务直接挂钩,因此生命周期比较长。还有一些对象主要是程序运行过程中生成的临时变量,这些对象生命周期会比较短,比如String对象,由于其不变类的特性,系统会产生大量的这些对象,有些对象甚至只用一次即可回收。
试想,在不进行对象存活时间区分的情况下,每次垃圾回收都是对整个堆空间进行回收,花费时间相对会长,同时,因为每次回收都需要遍历所有存活对象,但实际上,对于生命周期长的对象而言,这种遍历是没有效果的,因为可能进行了很多次遍历,但是他们依旧存在。因此,分代垃圾回收采用分治的思想,进行代的划分,把不同生命周期的对象放在不同代上,不同代上采用最适合它的垃圾回收方式进行回收。
分代的好处:如果单纯从JVM的功能考虑(用简单粗暴的标记-清理删除垃圾对象),并不需要新生代,完全可以针对整个堆进行操作,但是每次GC都针对整个堆标记清理回收对象太慢了。把堆划分为新生代和老年代有2个好处:
简化了新对象的分配(只在新生代分配内存),可以更有效的清除不再需要的对象(死对象)。
在新生代中,GC可以快速标记回收“死对象”,而不需要扫描整个堆中的存活一段时间的“老对象”。
什么情况下触发垃圾回收:由于对象进行了分代处理,因此垃圾回收区域、时间也不一样。GC有两种类型:Scavenge GC和Full GC。Scavenge GC:当新对象生成,并且在Eden申请空间失败时,就会触发Scavenge GC,对Eden区域进行GC,清除非存活对象,并且把尚且存活的对象移动到Survivor区。这种方式的GC是对年轻代的Eden区进行,不会影响到年老代。因为大部分对象都是从Eden区开始的,同时Eden区不会分配的很大,所以Eden区的GC会频繁进行。一般在这里需要使用速度快、效率高的算法,使Eden区能尽快空闲出来。
Full GC:对整个堆进行整理,包括Young、Tenured和Perm。Full GC因为需要对整个堆进行回收,所以比Scavenge GC要慢,因此应该尽可能减少Full GC的次数。在对JVM调优的过程中,很大一部分工作就是对于FullGC的调节。有如下原因可能导致Full GC:
旧生代空间不足
持久代空间不足
CMS GC时出现了promotion failed和concurrent mode failure
统计得到新生代minor gc时晋升到旧生代的平均大小小于旧生代剩余空间
直接调用System.gc,可以DisableExplicitGC来禁止
分配担保:老年代的对象中,有一小部分是因为在新生代回收时,老年代做担保,进来的对象;绝大部分对象是因为很多次GC都没有被回收掉而进入老年代。
新生代GC
一句话总结:对象开始是创建在Eden区,然后经过在Survivor区域上的数次转移而存活下来的长寿对象最后会被移到老年代。
Eden区:
当进行Eden区的回收时,垃圾回收器会从根对象开始遍历所有的可达对象,并将它们标记为存活状态。
标记完成后,所有存活对象会被复制到其中一个Survivor区。
于是整个Eden区便可认为是清空了,又可以重新用来分配对象了。
这个过程叫做标记复制(Mark and Copy):存活对象先被标记,随后被复制到Survivor区中。
Survivor区:
紧挨着Eden的两个Survivor区其中一个Survivor区始终都是空的。
空的Survivor区会在下一次新生代GC的时候迎来它的居民。
整个新生代中的所有存活对象(Eden和from区)都会被复制到to区中。
一旦完成之后,对象便都跑到to区中,而Eden和from区则被清空了。
这时from区和to区两者的角色便会发生调转(下次GC时仍然从from到to)。
对象提升到老年代:
存活对象会不断地在两个存活区之间来回地复制,直到其中的一些对象被认为是已经成熟,足够老了。
在一轮GC完成后,每个分区中存活下来的对象的计数便会增加(如果刚刚从Eden存活下来其年龄=1),
当一个对象的年龄超过了一个特定的年老阈值之后,它便会被提升到老年代中。
出现对象提升的时候,这些对象则不会再被复制到另一个存活区,而是直接复制到老年代中。
如果存活区的大小不足以存放所有的新生代存活对象,则会出现过早提升。
步骤
1.对象分配
2.填充到Eden区
3.将Eden区中存活的对象(引用对象)拷贝到其中一个存活区
4.年龄计数器:在Eden中存活的对象其年龄初始=1,从其他存活区存活下来年龄+1
5.增加年龄计数器,图中To存活区有三个对象来自于From存活区,一个对象来自Eden
6.对象提升,这里假设年龄阈值=8,发生GC时,From存活区中=8的对象提升到老年代,其他存活对象移动到To存活区
7.总结下对象提升的过程:对象在新生代分配,每当熬过一次YGC,对象的年龄计数器+1,当达到阈值时仍然存活,提升到老年代
8.总结下GC过程:对象在新生代分配并填充,当新生代满时发生YGC,当对象在存活区熬过一定年龄,提升到老年代
新生代GC的特点:
只要JVM无法为新创建的对象分配空间,就肯定会触发新生代GC,比如Eden区满了。因此对象创建得越频繁,新生代GC肯定也更频繁
一旦内存池满了,它的所有内容就会被拷贝走,指针又将重新归零。因此和经典的标记、清除、整理的过程不同的是
Eden区和Survivor区的清理只涉及到标记和拷贝。在它们中是不会出现碎片的。写指针始终在当前使用区的顶部
在一次新生代GC事件中,通常不涉及到年老代。年老代到年轻代的引用被认为是GC的根对象。而在标记阶段中,从年轻代到年老代的引用则会被忽略掉
所有的新生代GC都会触发stop-the-world暂停,这会中断应用程序的线程。对绝大多数应用而言,暂停的时间是可以忽略不计的
合理设置新生代大小
新生代过小,会导致新生对象很快就晋升,到老年代中,在老年代中对象很难被回收
新生代过大,会发生过多的复制过程
我们的目标是:最小化短命对象晋升到老年代的数量,最小化新生代GC的次数和持续时间
JVM的新生代GC算法
Serial Copying:单CPU、新生代小、对暂停时间要求丌高的应用
Parallel Scavenge:多CPU、对暂停时间要求较短的应用
ParNew:Serial Copying的多线程版本
均使用复制算法,在分配对象时,如果Eden空间不足触发新生代GC
JVM的新生代GC优化
指针碰撞(bump-the-pointer):Bump-the-pointer技术会跟踪在Eden上新创建的对象。由于新对象被分配在Eden空间的最上面,所以后续如果有新对象创建,只需要判断新创建对象的大小是否满足剩余的Eden空间。如果新对象满足要求,则其会被分配到Eden空间,同样位于Eden的最上面。所以当有新对象创建时,只需要判断此新对象的大小即可,因此具有更快的内存分配速度。
然而,在多线程环境下,将会有别样的状况。为了满足多个线程在Eden空间上创建对象时的线程安全,不可避免的会引入锁,因此随着锁竞争的开销,创建对象的性能也大打折扣。
线程局部分配缓冲区(Thread-Local Allocation Buffers):
在HotSpot中正是通过TLABs解决了多线程问题。TLABs允许每个线程在Eden上有自己的小片空间,线程只能访问其自己的TLAB区域,因此bump-the-pointer能通过TLAB在不加锁的情况下完成快速的内存分配。
老年代GC
老年代GC算法:
Serial MSC/Serial Old/Serial Mark Sweep Compact
Parallel Compacting/Parallel Old
CMS
下图是新生代GC和老年代GC的几种组合方式:
新生代Serial+老年代Serial(Serial Old)
新生代ParNew+老年代Serial(Serial Old)
新生代Parallel Scavenge+老年代Parallel(Parallel Old)
CMS收集器:
CMS GC工作流程
CMS GC是针对老年代的GC算法,CMS采用标记清理算法,只不过并不是严格意义的标记清理
1.年轻代被分割成一个Eden区和两个survivor区,老年代是一片连续空间
2.你的JAVA程序运行一段时间后,对象分散地分布在老年代中,
使用CMS,老年代是对象消亡的地方,它们不会被移动,也不会被压缩,除非遇到一个Full GC
3.年轻代GC工作过程:
① 存活的对象从Eden区或一个Survivor区,移动到另外一个Survivor区
② 一些老的对象如果达到了晋升阈值,就会被提升到老年代中
4.年轻代GC后,Eden区和其中一个Survivor区会被清理,Survivor中存活对象如果超过晋升阈值,晋升到老年代
5.老年代GC采用标记清理算法
6.老年代GC经过清理阶段后,很多内存会被释放,但是仍然没有压缩
CMS(Concurrent Mark Sweep)
CMS收集器是一种以获取最短回收停顿时间为目标的收集器(尽可能降低停顿),它是基于“标记-清除”算法实现的,它的目标是尽量减少应用的暂停时间,减少Full GC发生的几率,利用和应用程序线程并发(允许垃圾回收线程和应用线程共享处理器资源,比如下面的步骤2、3并发两个阶段)的垃圾回收线程来标记清除年老代。整个收集过程大致分为4个步骤:
初始标记(CMS-initial-mark):从根对象开始标记直接关联的对象,会产生全局停顿
并发标记(CMS-concurrent-mark):进行GC Root根搜索算法阶段,会判定对象是否存活
重新标记(CMS-remark):由于并发标记时,用户线程依然运行,因此在正式清理前,再做修正。
这个阶段的停顿时间会被初始标记阶段稍长,但比并发标记阶段要短
并发清除(CMS-concurrent-sweep):基于标记结果,直接清理对象(清理的是没有标记的对象)
下图结合了其他类型的收集器,对比CMS。可以看到CMS只不过是把一段较长的Stop the World暂停所有应用程序,分成了两个较短的暂停。第一次暂停(初始标记)从GC Roots对象开始标记存活的对象;第二次暂停(重新标记)是在并发标记之后,重新标记并发标记阶段遗漏的对象(在并发标记阶段结束后对象状态的更新导致)。第一次暂停会比较短,第二次暂停通常会比较长,并且重新标记这个阶段可以并行标记(初始标记使用一个线程,重新标记使用多线程)。
CMS收集器的优点:由于整个过程中耗时最长的并发标记和并发清除过程中,收集器线程都可以与用户线程一起工作,所以整体来说,CMS收集器的内存回收过程是与用户线程一起并发执行的。
CMS收集器的缺点:
1.与其他GC相比,CMS GC要求更多的内存空间和CPU资源。在并发阶段,虽然不会导致用户线程停顿,但是会占用CPU资源而导致引用程序变慢,总吞吐量下降。CMS默认启动的回收线程数是:(CPU数量+3)/4,可以通过-XX:ParallelCMSThreads设定CMS的线程数量。由于GC线程与应用抢占CPU,会影响系统整体吞吐量和性能:在用户线程运行过程中,分一半CPU去做GC,系统性能在GC阶段就下降一半。
2.清理不彻底,会产生浮动垃圾:因为在并发清理阶段(步骤4),伴随程序的运行自然会有新的垃圾不断产生,这一部分垃圾出现在标记过程之后,CMS无法在本次收集中处理它们,只好留待下一次GC时将其清理掉。
3.因为GC的同时应用也在运行,不能在老年代空间快满时再清理,Old区需要预留足够的内存空间给用户线程使用:否则如果在并发GC期间(步骤4),用户线程又申请了大量内存(即使产生的是垃圾对象,也没办法在本次清理),导致内存不够。如果预留的空间不够,就会出现Concurrent Mode Failure的错误。
因此CMS收集器不能像其他收集器那样等到老年代几乎完全被填满了再进行收集,需要预留一部分内存空间提供并发收集时的程序运作使用。在默认设置下,CMS收集器在老年代使用了68%的空间时就会被激活,也可以通过参数-XX:CMSInitiatingOccupancyFraction的值来提供触发百分比,以降低内存回收次数提高性能。要是CMS运行期间预留的内存无法满足程序其他线程需要,就会出现”Concurrent Mode Failure”失败,这时候虚拟机将启动后备预案:临时启用Serial Old收集器来重新进行老年代的垃圾收集,这样停顿时间就很长了。所以说参数-XX:CMSInitiatingOccupancyFraction设置的过高将会很容易导致”Concurrent Mode Failure”失败,性能反而降低。
假设Old GC时,老年代总内存=10G,占用了9G(由于碎片存在,不足分配新对象,发生Old GC)
在并行清理阶段,即使把垃圾都清理完,释放了3G,现在占用9-3=6G,但是如果在并发清理阶段
新产生的对象占用了4G,本次垃圾无法清理,导致内存占用=6+4=10G,老年代空间又满了!
所以对于老年代的GC应该预留一定的内存空间给并发清理阶段产生的对象,默认值是68%。
假设老年代总内存=10G,当使用了6.8G时,就会触发老年代GC,而不是等到差不多占满才触发。
举例使用6.8G后,释放了3G,现在占用6.8-3=3.8G,即使新产生了4G不会在本次垃圾收集被清理
总的内存占用也指头3.8+4=7.8G,虽然又会触发一次老年代GC,但是不至于把老年代的内存用光。
4.CMS GC默认不提供内存压缩,为了避免过多的内存碎片而需要执行压缩任务时,CMS GC会比任何其他GC带来更多的stop-the-world时间:因为整理过程是独占的,会引起停顿时间变长。不过CMS允许设置进行几次Full GC后,进行一次碎片整理。
CMS是基于“标记-清除”算法实现的收集器,使用“标记-清除”算法收集后,会产生大量碎片。空间碎片太多时,将会给对象分配带来很多麻烦,比如说大对象,内存空间找不到连续的空间来分配不得不提前触发一次Full GC。为了解决这个问题,CMS收集器提供了一个-XX:UseCMSCompactAtFullCollection开关参数,用于在Full GC之后增加一个碎片整理过程,还可通过-XX:CMSFullGCBeforeCompaction参数设置执行多少次不压缩的Full GC之后,跟着来一次碎片整理过程。
Q&A
为什么CMS要使用标记清除而不是标记压缩?:如果使用标记压缩,需要对(存活)对象的内存位置进行改变,这样程序就很难继续执行
CMS采用标记清除有什么缺点?:标记清除会产生大量内存碎片,不利于内存分配
CMS有没有暂停?:CMS并非没有暂停,而是用两次短暂停来替代串行标记整理算法的长暂停
CMS中的C(Concurrent)并发什么意思:并发标记、并发清除、并发重设阶段的所谓并发,是指一个或者多个垃圾回收线程和应用程序线程并发地运行,垃圾回收线程不会暂停应用程序的执行,如果你有多于一个处理器,那么并发收集线程将与应用线程在不同的处理器上运行,显然,这样的开销就是会降低应用的吞吐量。Remark阶段的并行,是指暂停了所有应用程序后,启动一定数目的垃圾回收进程进行并行标记,此时的应用线程是暂停的。
CMS GC日志
1
2
3
4
5
6
7
8
9
10
1.662: [GC [1CMS-initial-mark:28122K(49152K)]29959K(63936K),0.0046877secs] [Times: user=0.00sys=0.00, real=0.00secs]
1.666: [CMS-concurrent-mark-start]
1.699: [CMS-concurrent-mark:0.033/0.033secs] [Times: user=0.25sys=0.00, real=0.03secs]
1.699: [CMS-concurrent-preclean-start]
1.700: [CMS-concurrent-preclean:0.000/0.000secs] [Times: user=0.00sys=0.00, real=0.00secs]
1.700: [GC[YG occupancy:1837K (14784K)]1.700: [Rescan (parallel) ,0.0009330secs]1.701: [weak refs processing,0.0000180secs] [1CMS-remark:28122K(49152K)]29959K(63936K),0.0010248secs] [Times: user=0.00sys=0.00, real=0.00secs]
1.702: [CMS-concurrent-sweep-start]
1.739: [CMS-concurrent-sweep:0.035/0.037secs] [Times: user=0.11sys=0.02, real=0.05secs]
1.739: [CMS-concurrent-reset-start]
1.741: [CMS-concurrent-reset:0.001/0.001secs] [Times: user=0.00sys=0.00, real=0.00secs]
G1 GC