文本来自:《深入理解Java虚拟机》部分修改
对象生成
我们知道在Java代码中,通过
Object o = new Object();
这样的语句就可以创建对象及其引用,对象的创建只不过是一个new关键字而已,那么在虚拟机中又是一个怎样的过程呢?
HotSpot检测到new指令之后会进行下面几步操作:
一 .检测类是否加载
判断类是否加载。虚拟机遇到一条new指令的时候,首先会检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号代表的类是否被加载、解析并初始化。如果没有完成这个过程,则必须执行相应类的加载。确保类加载完成之后才能生成其实例。
二. 堆上分配空间
在堆上为对象分配空间。所有对象都是在堆上分配空间的,但是随着时代的发展已经不是那么绝对了,对象需要的空间大小在类加载完成后便能确定。之后便是在堆上为该对象分配固定大小的空间。分配的方式也有两种:
i.第一种如果使用Serial、ParNew等带Compact过程的收集器的时候,Java内存中的堆都是规整的,只需把作为使用和未使用空间的分界点的指针移动一段距离就可以了,称为指针碰撞方式。
ii.第二种如果使用CMS这种基于Mark-Sweep算法的收集器的时候,Java内存并不是规整的,虚拟机就要维护了一个列表来记录内存的使用情况,这种方式叫做“空闲列表”的方式。
虚拟机为对象分配空间是非常频繁的,如果同时为多个线程分配对象,就可能发生指针错误控制,就涉及到并发安全控制了。一般有两个解决方案:
(1)第一种是对分配内存空间动作进行同步-使用CAS配上失败重试的方式保证更新操作的原子性。
(2)第二种是把内存分配的动作分配在不同的空间中进行,既每个线程在Java堆中预先分配一小块内存,称之为本地线程分配缓冲(ThreadLocalAllocationBuffer,TLAB)。哪个线程要分配内存,就在哪个线程的TLAB上分配。只有TLAB使用完并需要分配新的TLAB的时候才需要同步锁定。
三.初始化内存
初始化内存空间。内存分配完成之后,虚拟机会将分配空间内都初始化为零(不包括对象头),如果使用TLAB分配,这一过程也可以提前至TLAB分配时进行。
四.设置对象头
设置对象的对象头。接下来虚拟机要设置对象的对象头。包括对象的哈希码、类元素信息、GC分代年龄等。这些信息都放置在对象头中。
对象头是必不可少的一部分。
五.初始化类成员
执行方法,初始化对象内成员。
执行完这五步,一个对象才算是真正产生。
对象组成
内存中,对象存储布局可分为三部分:对象头(Header),实例数据(InstanceData)和对齐填充(Padding)。
1.对象头:包括两部分信息。第一部分用于存储对象自身的运行时数据,如哈希码,GC分代年龄、锁状态、线程持有锁、等等。这部分数据的长度在32为或64位,官方称之为“MarkWord”。对象头的另一部分是类型指针,即对象指向它的类元素的指针,通过这个指针来确定这个对象时那个类的实例。(如果Java对象时一个数组,则对象头还必须有一块用于记录数组长度的数据。因为Java数组元数据中没有数组大小的记录)
2.实例数据:这部分是真正用来存储对象有效信息的地方,也就是在代码中定义的,包括父类的属性等
3.对齐填充:这部分并不是必需存在的,只是起着占位符的作用。因为HotSpot虚拟机要求对象起始地址必须是8字节的倍数。而对象头是8字节或者16字节,加入实例数据不是8的整数倍,那么就需要padding来补充。
对象引用
我们可以通过使用栈上的reference数据来操作堆上的具体对象。有两种方式来访问具体对象:句柄和直接指针。
句柄:Java堆中划分出一个句柄池,专门用来存放对象的实例地址和类型地址。而栈中的reference只是该句柄池中某一句柄的地址。
这样做的好处是当进行垃圾回收并被移动后,对象地址改变而reference的数据不用改变。
直接指针:reference直接指向某一对象的地址。好处便是速度快,节省了一次定位的时间开销。