要了解 synchronized 的原理需要先理清楚两件事情:对象头和 Monitor。在JVM中,对象是分成三部分存在的:
对象头
实例数据
对其填充
实例数据和对其填充与synchronized无关
Java对象在堆内存分布
当我们在 Java 代码中,使用 new 创建一个对象的时候,JVM 会在堆中创建一个 instanceOopDesc 对象,这个对象中包含了对象头以及实例数据。
instanceOopDesc 的基类为 oopDesc 类。它的结构如下:
其中 _mark 和 metadata 一起组成了对象头。metadata 主要保存了类元数据,不需要做过多介绍。这里重点看下 _mark 属性,_mark 是 markOop 类型数据,一般称它为标记字段(Mark Word),其中主要存储了对象的 hashCode、分代年龄、锁标志位,是否偏向锁等。
实例数据存放类的属性数据信息,包括父类的属性信息,如果是数组的实例部分还包括数组的长度,这部分内存按4字节对齐;对其填充不是必须部分,由于虚拟机要求对象起始地址必须是8字节的整数倍,对齐填充仅仅是为了使字节对齐。对象头是我们需要关注的重点,它是synchronized实现锁的基础,因为synchronized申请锁、上锁、释放锁都与对象头有关。
对象头主要结构是由Mark Word 和 Class Metadata Address 组成,其中Mark Word存储对象的hashCode、锁信息或分代年龄或GC标志等信息,Class Metadata Address是类型指针指向对象的类元数据,JVM通过该指针确定该对象是哪个类的实例。
用一张图来表示 32 位 Java 虚拟机的 Mark Word 的默认存储结构如下:
锁也分不同状态
JDK6之前只有两个状态:无锁、有锁(重量级锁)
而在JDK6之后对synchronized进行了优化,新增了两种状态,总共就是四个状态:
- 无锁状态、
- 偏向锁、
- 轻量级锁、
- 重量级锁,
其中无锁就是一种状态了。锁的类型和状态在对象头Mark Word中都有记录,在申请锁、锁升级等过程中JVM都需要读取对象的Mark Word数据。
每一个锁都对应一个monitor对象,在HotSpot虚拟机中它是由ObjectMonitor实现的(C++实现)。每个对象都存在着一个monitor与之关联,对象与其monitor之间的关系有存在多种实现方式,如monitor可以与对象一起创建销毁或当线程试图获取对象锁时自动生成,但当一个monitor被某个线程持有后,它便处于锁定状态。
ObjectMonitor() {
_header = NULL;
_count = 0; //锁计数器
_waiters = 0,
_recursions = 0;
_object = NULL;
_owner = NULL;
_WaitSet = NULL; //处于wait状态的线程,会被加入到_WaitSet
_WaitSetLock = 0 ;
_Responsible = NULL ;
_succ = NULL ;
_cxq = NULL ;
FreeNext = NULL ;
_EntryList = NULL ; //处于等待锁block状态的线程,会被加入到该列表
_SpinFreq = 0 ;
_SpinClock = 0 ;
OwnerIsThread = 0 ;
}
默认情况下,没有线程进行加锁操作,所以锁对象中的 Mark Word 处于无锁状态。但是考虑到 JVM 的空间效率,Mark Word 被设计成为一个非固定的数据结构,以便存储更多的有效数据,它会根据对象本身的状态复用自己的存储空间,如 32 位 JVM 下,除了上述列出的 Mark Word 默认存储结构外,还有如下可能变化的结构:
Monitor
Monitor 可以把它理解为一个同步工具,也可以描述为一种同步机制。实际上,它是一个保存在对象头中的一个对象。在 markOop 中有如下代码:
通过 monitor() 方法创建一个 ObjectMonitor 对象,而 ObjectMonitor 就是 Java 虚拟机中的 Monitor 的具体实现。因此 Java 中每个对象都会有一个对应的 ObjectMonitor 对象,这也是 Java 中所有的 Object 都可以作为锁对象的原因。
ObjectMonitor 其中有几个比较关键的属性:
当多个线程同时访问一段同步代码时,首先会进入 _EntryList 队列中,当某个线程通过竞争获取到对象的 monitor 后,monitor 会把 _owner 变量设置为当前线程,同时 monitor 中的计数器 _count 加 1,即获得对象锁。
若持有 monitor 的线程调用 wait() 方法,将释放当前持有的 monitor,_owner 变量恢复为 null, _count 自减 1,同时该线程进入 _WaitSet 集合中等待被唤醒。若当前线程执行完毕也将释放 monitor(锁)并复位变量的值,以便其他线程进入获取 monitor(锁)。
ObjectMonitor 工作机制
ObjectMonitor中有两个队列
**_WaitSet ** 等待锁的线程集合
_EntryList,进入锁范围的线程集合
Demo演示
通过 3 个线程分别执行以下同步代码块,锁对象是 lock 对象,在 JVM 中会有一个 ObjectMonitor 对象与之对应。如下图所示:
分别使用 3 个线程来执行以上同步代码块。默认情况下,3 个线程都会先进入 ObjectMonitor 中的 EntrySet 队列中,如下所示:
假设线程 2 首先通过竞争获取到了锁对象,则 ObjectMonitor 中的 Owner 指向线程 2,并将 count 加 1。结果如下:
上图中 Owner 指向线程 2 表示它已经成功获取到锁(Monitor)对象,其他线程只能处于阻塞(blocking)状态。如果线程 2 在执行过程中调用 wait() 操作,则线程 2 会释放锁(Monitor)对象,以便其他线程进入获取锁(Monitor)对象,Owner 变量恢复为 null,count 做减 1 操作,同时线程 2 会添加到 WaitSet 集合,进入等待(waiting)状态并等待被唤醒。结果如下:
如果在线程 1 执行过程中调用 notify 操作将线程 2 唤醒,则当前处于 WaitSet 中的线程 2 会被重新添加到 EntrySet 集合中,并尝试重新获取竞争锁(Monitor)对象。但是 notify 操作并不会是使程 1 释放锁(Monitor)对象。结果如下
当线程 1 中的代码执行完毕以后,同样会自动释放锁,以便其他线程再次获取锁对象。
实际上,ObjectMonitor 的同步机制是 JVM 对操作系统级别的 Mutex Lock(互斥锁)的管理过程,其间都会转入操作系统内核态。也就是说 synchronized 实现锁,在“重量级锁”状态下,当多个线程之间切换上下文时,还是一个比较重量级的操作。
JVM对synchronized的优化
从 Java 6 开始,虚拟机对 synchronized 关键字做了多方面的优化,主要目的就是,避免 ObjectMonitor 的访问,减少“重量级锁”的使用次数,并最终减少线程上下文切换的频率 。其中主要做了以下几个优化: 锁自旋、轻量级锁、偏向锁。
上面讲到锁有四种状态,并且会因实际情况进行膨胀升级,其膨胀方向是:无锁——>偏向锁——>轻量级锁——>重量级锁,并且膨胀方向不可逆。
锁自旋
线程的阻塞和唤醒需要 CPU 从用户态转为核心态,频繁的阻塞和唤醒对 CPU 来说是一件负担很重的工作,势必会给系统的并发性能带来很大的压力,所以 Java 引入了自旋锁的操作。实际上自旋锁在 Java 1.4 就被引入了,默认关闭,但是可以使用参数 -XX:+UseSpinning 将其开启。但是从 Java 6 之后默认开启。
所谓自旋,就是让该线程等待一段时间,不会被立即挂起,看当前持有锁的线程是否会很快释放锁。而所谓的等待就是执行一段无意义的循环即可(自旋)。
自旋锁也存在一定的缺陷:自旋锁要占用 CPU,如果锁竞争的时间比较长,那么自旋通常不能获得锁,白白浪费了自旋占用的 CPU 时间。这通常发生在锁持有时间长,且竞争激烈的场景中,此时应主动禁用自旋锁。
偏向锁
轻量级锁是在没有锁竞争情况下的锁状态,但是在有些时候锁不仅存在多线程的竞争,而且总是由同一个线程获得。因此为了让线程获得锁的代价更低引入了偏向锁的概念。偏向锁的意思是如果一个线程获得了一个偏向锁,如果在接下来的一段时间中没有其他线程来竞争锁,那么持有偏向锁的线程再次进入或者退出同一个同步代码块,不需要再次进行抢占锁和释放锁的操作。偏向锁可以通过 -XX:+UseBiasedLocking 开启或者关闭。
一句话总结它的作用:减少同一线程获取锁的代价。在大多数情况下,锁不存在多线程竞争,总是由同一线程多次获得,那么此时就是偏向锁。
核心思想:如果一个线程获得了锁,那么锁就进入偏向模式,此时Mark Word的结构也就变为偏向锁结构,当该线程再次请求锁时,无需再做任何同步操作,即获取锁的过程只需要检查Mark Word的锁标记位为偏向锁以及当前线程ID等于Mark Word的ThreadID即可,这样就省去了大量有关锁申请的操作。
偏向锁的具体实现就是在锁对象的对象头中有个 ThreadId 字段,默认情况下这个字段是空的,当第一次获取锁的时候,就将自身的 ThreadId 写入锁对象的 Mark Word 中的 ThreadId 字段内,将是否偏向锁的状态置为 01。这样下次获取锁的时候,直接检查 ThreadId 是否和自身线程 Id 一致,如果一致,则认为当前线程已经获取了锁,因此不需再次获取锁,略过了轻量级锁和重量级锁的加锁阶段。提高了效率。
过程: 先说无锁—>偏向锁。锁的标志位都为01。
当一个线程访问同步块并获取锁时,会在对象头和栈帧中的锁记录里存储锁偏向的线程ID,以后该线程在进入和退出同步块时不需要花费CAS操作来加锁和解锁,而只需简单的测试一下对象头的Mark Word里是否存储着指向当前线程的偏向锁,如果测试成功,表示线程已经获得了锁,如果测试失败,则需要再测试下Mark Word中偏向锁的标识是否设置成1(表示当前是偏向锁),如果没有设置,则使用CAS竞争锁,如果设置了,则尝试使用CAS将对象头的偏向锁指向当前线程。
要注意的是,偏向锁使用了一种等到竞争出现才释放锁的机制,所以当其他线程尝试竞争偏向锁时,持有偏向锁的线程才会释放锁。偏向锁的撤销,需要等待全局安全点(在这个时间点上没有字节码正在执行),它会首先暂停拥有偏向锁的线程,然后检查持有偏向锁的线程是否活着,如果线程不处于活动状态,则将对象头设置成无锁状态,如果线程仍然活着,拥有偏向锁的栈会被执行,遍历偏向对象的锁记录,栈中的锁记录和对象头的Mark Word要么重新偏向于其他线程,要么恢复到无锁或者标记对象不适合作为偏向锁,最后唤醒暂停的线程。
轻量级锁
轻量级锁是由偏向锁升级而来,当存在第二个线程申请同一个锁对象时,偏向锁就会立即升级为轻量级锁。注意这里的第二个线程只是申请锁,不存在两个线程同时竞争锁,可以是一前一后地交替执行同步块。
有时候 Java 虚拟机中会存在这种情形:对于一块同步代码,虽然有多个不同线程会去执行,但是这些线程是在不同的时间段交替请求这把锁对象,也就是不存在锁竞争的情况。在这种情况下,锁会保持在轻量级锁的状态,从而避免重量级锁的阻塞和唤醒操作。
要了解轻量级锁的工作流程,还是需要再次看下对象头中的 Mark Word。上文中已经提到,锁的标志位包含几种情况:00 代表轻量级锁、01 代表无锁(或者偏向锁)、10 代表重量级锁、11 则跟垃圾回收算法的标记有关。
当线程执行某同步代码时,Java 虚拟机会在当前线程的栈帧中开辟一块空间(Lock Record)作为该锁的记录,如下图所示:
当线程再次执行此同步代码块时,判断当前对象的 Mark Word 是否指向当前线程的栈帧,如果是则表示当前线程已经持有当前对象的锁,则直接执行同步代码块;否则只能说明该锁对象已经被其他线程抢占了,这时轻量级锁需要膨胀为重量级锁。
重量级锁
重量级锁是由轻量级锁升级而来,当同一时间有多个线程竞争锁时,锁就会被升级成重量级锁,此时其申请锁带来的开销也就变大。
重量级锁一般使用场景会在追求吞吐量,同步块或者同步方法执行时间较长的场景。