new关键字在java中是用来实例化一个对象,看似非常轻松的一个关键字,在JVM中(下文均指Hotspot虚拟机)都是如何运转的、对象如何分配出来、内部的成员变量如何初始化、这么“大”的对象数据都怎么存放的、程序如何访问,接下来就一探究竟。
对象创建
加载阶段
当程序执行到new关键字的时候,其实我们希望告诉JVM帮我们在内存中分配一块内存区域,并将把实例中的一些预值装配好。JVM接到我们指令后就开始到常量池中去定位这个类的引用,检查类是否被加载、解析和初始化过。如果没有就需要执行相应的加载过程,详细的类加载过程可以参考:Java类加载原理解析
分配内存
在#JVM内核#运行时数据区域中介绍了,类被加载后它所需要的内存空间大小就会被确定,new的过程中JVM会从堆内存中分配出一块确定大小的空间供新的对象实例使用。
根据Java堆中的内存是不是整齐(是否争取取决于我们使用的GC收集器算法
)会有两种不同的分配方式:
- 指针碰撞(Bump the pointer)
内存整齐的Java堆中使用一个指针来划分空间内存和使用内存,分配内存也就是把指针向空闲空间那边移动一段与内存大小相等的距离。这类收集器有Serial、ParNew - 空闲列表(Free List)
内存不整齐也就是空间内存和使用内存是交替的,这个时候我们很难用一个指针来划分空间和使用空间的地址。JVM维护了一个列表,记录每个地址的使用情况。在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录。在CMS收集器中使用的Mark-Sweep(标记-清除)算法就是这样的方式
对象创建在虚拟机中时非常频繁的行为,即使是仅仅修改一个指针指向的位置,在并发情况下也并不是线程安全的,可能出现正在给对象A分配内存,指针还没来得及修改,对象B又同时使用了原来的指针来分配内存的情况,那么如何来解决这个问题,JVM给出了两种方案:
- 对分配内存空间的动作进行同步处理---实际上虚拟机采用
CAS
配上失败重试
的方式保证更新操作的原子性; - 把内存分配的动作按照线程划分为在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲(TLAB)。哪个线程要分配内存,就在哪个线程的TLAB上分配。只有TLAB用完并分配新的TLAB时,才需要同步锁定。
** 内存空间初始化**
虚拟机将分配到的内存空间都初始化为零值(不包括对象头),如果使用了TLAB,这一工作过程也可以提前至TLAB分配时进行。
内存空间初始化保证了对象的实例字段在Java代码中可以不赋初始值就直接使用,程序能访问到这些字段的数据类型所对应的零值。
对象设置
虚拟机对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息存放在对象的对象头之中。
<init>
在上面的工作都完成之后,从虚拟机的角度看,一个新的对象已经产生了。但是从Java程序的角度看,对象的创建才刚刚开始<init>方法还没有执行,所有的字段都还是零。所以,一般来说(由字节码中是否跟随invokespecial指令所决定),执行new指令之后会接着执行<init>方法,把对象按照程序员的意愿进行初始化,这样一个真正可用的对象才算产生出来。
内存布局
在HotSpot虚拟机中,对象在内存中存储的布局可以分为3块区域:
- 对象头(Header)
- 实例数据(Instance Data)
- 对齐填充(Padding)
下图清晰可见各个区域:
对象访问
Object objectRef = new Object();
假设这句代码出现在方法体中,"Object objectRef” 这部分将会反映到Java栈的本地变量中,作为一个reference类型数据出现。而“new Object()”这部分将会反映到Java堆中,形成一块存储Object类型所有实例数据值的结构化内存,根据具体类型以及虚拟机实现的对象内存布局的不同,这块内存的长度是不固定。
reference类型在java虚拟机规范里面只规定了一个指向对象的引用地址,并没有定义这个引用应该通过那种方式去定位,访问到java堆中的对象位置,因此不同的虚拟机实现的访问方式可能不同,主流的方式有两种:
-
使用句柄
Java堆中将划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据和类型数据各自的具体地址信息
-
直接指针
reference变量中直接存储的就是对象的地址,而java堆对象一部分存储了对象实例数据,另外一部分存储了对象类型数据
这两种访问对象的方式各有优势,使用句柄访问方式最大好处就是reference中存储的是稳定的句柄地址,在对象移动时只需要改变句柄中的实例数据指针,而reference不需要改变。使用指针访问方式最大好处就是速度快,它节省了一次指针定位的时间开销,就Hotspot虚拟机而言,它使用的是第二种方式(直接指针访问)
参考
http://www.infoq.com/cn/articles/jvm-hotspot/
http://blog.csdn.net/u010942020/article/details/42836127
http://blog.csdn.net/java2000_wl/article/details/8015105