程序计数器(线程私有)
指针,指向方法区中堆方法字节码,用来存储指向下一条指令的堆地址。如果线程正在执行java方法,则这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是Native方法,这个计数器值为空(Undefined)。此内存区域是唯一一个在java虚拟机规范中没有规定任何OutOfMemoryError情况的区域。
栈(线程私有)
java线程执行方法的内存模型,一个线程对应一个栈,没个方法在执行的同时都会创建一个栈帧用于存储局部变量表,操作数栈,动态连接,方法出口等信息,只要线程一结束该栈就释放,生命周期和线程一致,不存在垃圾回收问题。
局部变量表存放了编辑期可知的各种基本数据类型的对象(boolean、byte、char、short、int、float、long、double)、对象引用(reference类型,它不等同于对象本身,可能是一个指向对象起始地址的引用指针,也可能是指向一个代表对象的句柄或其他与此对象相关的位置)和returnAddress类型(指向了一条字节码指令的地址)。
在java虚拟机规范中,对栈这个区域规定了两种异常状况:如果线程 请求对栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常;如果虚拟机栈允许动态扩展,但在扩展时无法申请到足够的内存,就会抛出OutOfMemoryError异常。
本地方法栈(线程私有)
与栈作用相似,本地方法栈为虚拟机使用到的Native方法服务。登记Native方法,在Execution Engine执行时加载本地方法库。
方法区(线程共享)
用于存储已被虚拟机加载的类信息(类的所有字段和方法字节码,以及一些特殊方法如构造函数,接口代码)、常量、静态变量、即时编译器编译后的代码等数据。简单来说,所有定义的方法的信息都保存在该区域,静态变量+常量+类信息(构造方法/接口定义)+运行时常量池都存在方法区中,虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做Non-Heap(非堆),目的应该是为了和Java的堆区分开
运行时常量池
方法区的一部分,class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池,用于存放编译期生成等各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。
运行时常量池相对于Class文件常量池的另外一个重要特征是具备动态性,Java语言并不要求常量一定只有编译期才能产生,也就是并非预直入Class文件中国呢常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中,这种特性被开发人员利用的比较多的便是String类的intern方法。
堆(线程共享)
虚拟机启动时自动分配创建,用于存放对象的实例,几乎所有对象(包括常量池)都在堆上分配内存,但不存放基本类型和对象引用,只存放对象本身,当对象无法在 该空间申请到内存是将抛出OutOfMemoryError异常。同时也是垃圾收集器管理的主要区域。
新生代(Young Generation)
类出生、成长、消亡的区域,一个类在这里产生,应用,最后被垃圾回收器收集,结束生命。新生代分为伊甸区和幸存者区。
伊甸区(Eden space)
所有的类都是在伊甸区被new出来的。
幸存者区(Survivor sapce)
幸存者区又分为from和to区。当eden区的空间用完时,程序又要创建对象,jvm的垃圾回收器将eden区进行垃圾回收(Minor GC或者叫Young GC),将eden区中的不再被其他对象应用的对象进行销毁。然后将eden区中剩余的对象移到from survivor区。若from survivor区也满了,再对该区进行垃圾回收,然后移到to survivor区。然后把to survivor变为from survivor区,from survivor区变为to survivor区,当对象在幸存者区转换15次之后还没有被回收,则把对象转移到老年代。
老年代(Old Generation)
新生代经过多次GC仍然存活的对象移动到老年区。若老年代也满了,这时候将发生Major GC(也叫Full GC),进行老年代的内存清理。若老年区执行了Full GC之后发现依然无法进行对象的保存,就会抛出OOM异常。
元空间(Meta Space)
在JDK1.8之后,元空间代替了永生代,它是对JCVM规范中方法区对实现,区别在于元数据区不在虚拟当中,而是用的本地内存,永久代在虚拟机当中,永久代逻辑结构上也属于堆,但物理上不属于。
如何定位垃圾
- 引用计数法
在对象头处维护一个counter,每增加一次对该对象的引用计数器+1,如果对该对象的引用失联,则计数器-1。当counter为0时,表明该对象已经被废弃,不处于存活状态。这种方式一方面无法区分软、虛、弱、强引用类别。另一方面,会造成死锁,假设两个对象相互引用始终无法释放counter,永远不能GC。
- 根可达算法
通过一系列的GC Roots的对象作为起始点,从这些根节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的。
可以作为GC Roots的对象包括:1)虚拟机栈(帧栈中的本地变量表)中引用的对象;2)方法区中的类静态属性引用的对象或者常量引用的对象。3)本地方法栈中JNI(就是native方法)引用的对象。
常见的垃圾回收算法
- 标记清除:标记清除算法采用从根集合(GC Roots)进行扫描,对存活的对象进行标记,标记完毕后,再扫描整个空间中未被标记的对象,进行回收,如下图所示。标记-清除算法不需要进行对象的移动,只需对不存活的对象进行处理,在存活对象比较多的情况下极为高效,但由于标记-清除算法直接回收不存活的对象,因此会造成内存碎片。
- 拷贝算法:从根集合(GC Roots)中扫描活动对象,并将每个活动对象复制到空闲面(使得活动对象所占的内存之间没有空闲洞),这样空闲面变成了对象面,原来的对象面变成了空闲面,程序会在新的对象面中分配内存。即from survivor 和 to survivor区互转。
- 标记压缩:在标记清除算法的
基础上,将所有存活对象往左端空间空间移动,并更新对应的指针。标记压缩算法是在标记-清除算法的基础上,又进行了对象的移动,因此成本更高,但是却解决了内存碎片的问题。
常见的垃圾回收器
- Serial收集器(拷贝算法):新生代单线程收集器,标记和清理都是单线程,优点是简单高效。是client级别默认的GC方式,可以通过-XX:+UseSerialGC来强制指定。
- Serial Old收集器(标记压缩算法):老年代单线程收集器。
- ParNew收集器(停止-拷贝算法):新生代收集器,可认为是Serial收集器的多线程版本,在多核cpu环境下有着比Serial更好的表现。
- PS(Parallel Scavenge)收集器(停止-拷贝算法):并行收集器,追求高吞吐量,高效利用CPU。吞吐量一般为99%, 吞吐量= 用户线程时间/(用户线程时间+GC线程时间)。适合后台应用等对交互相应要求不高的场景。是server级别默认采用的GC方式,可用-XX:+UseParallelGC来强制指定,用-XX:ParallelGCThreads=4 来指定线程数。
- PO(Parallel Old)收集器(停止-拷贝算法):PS收集器的老年代版本。
- CMS(Concurrent Mark Sweep)收集器(标记清除算法): 垃圾回收和应用程序同时运行,降低STW(stop the world)的时间(200ms)。CMS问题比较多,所以现在没有一个版本默认是CMS,只能手工指定。 CMS既然是MarkSweep,就一定会有碎片化的问题,碎片到达一定程度,CMS的老年代分配对象分配不下的时候,使用SerialOld进行老年代回收。高并发、低停顿,追求最短GC回收停顿时间,cpu占用比较高,响应时间快,停顿时间短,多核cpu 追求高响应时间的选择。
JDK1.8默认的垃圾回收:PS + ParallelOld
减少Full GC频率的方法
- 加大JVM内存
- 加大Young Generation的比例
- 提高Young Generation到Old Generation到年龄(默认15)
- 提高Survivor区到比例
- 避免代码内存泄漏