12.1 Java内存模型
12.1.1 主内存与工作内存
Java内存模型的主要目标是定义程序各个变量的访问规则,线程对变量的所有操作(读取、赋值等)都必须在工作内存中进行,而不能直接读写主内存中的变量.
12.1.2 内存间交互操作
关于主内存与工作内存之间的具体交互协议,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步到主内存之间的实现细节,Java内存模型定义了以下八种操作来完成:
- lock(锁定):作用于主内存的变量,把一个变量标识为一条线程独占状态。
- unlock(解锁):作用于主内存变量,把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定。
- read(读取):作用于主内存变量,把一个变量值从主内存传输到线程的工作内存中,以便随后的load动作使用
- load(载入):作用于工作内存的变量,它把read操作从主内存中得到的变量值放入工作内存的变量副本中。
- use(使用):作用于工作内存的变量,把工作内存中的一个变量值传递给执行引擎,每当虚拟机遇到一个需要使用变量的值的字节码指令时将会执行这个操作。
- assign(赋值):作用于工作内存的变量,它把一个从执行引擎接收到的值赋值给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
- store(存储):作用于工作内存的变量,把工作内存中的一个变量的值传送到主内存中,以便随后的write的操作。
- write(写入):作用于主内存的变量,它把store操作从工作内存中一个变量的值传送到主内存的变量中。
如果要把一个变量从主内存中复制到工作内存,就需要按顺寻地执行read和load操作,如果把变量从工作内存中同步回主内存中,就要按顺序地执行store和write操作。Java内存模型只要求上述操作必须按顺序执行,而没有保证必须是连续执行。也就是read和load之间,store和write之间是可以插入其他指令的,如对主内存中的变量a、b进行访问时,可能的顺序是read a,read b,load b, load a。Java内存模型还规定了在执行上述八种基本操作时,必须满足如下规则:
- 不允许read和load、store和write操作之一单独出现
- 不允许一个线程丢弃它的最近assign的操作,即变量在工作内存中改变了之后必须同步到主内存中。
- 不允许一个线程无原因地(没有发生过任何assign操作)把数据从工作内存同步回主内存中。
一个新的变量只能在主内存中诞生,不允许在工作内存中直接使用一个未被初始化(load或assign)的变量。即就是对一个变量实施use和store操作之前,必须先执行过了assign和load操作。 - 一个变量在同一时刻只允许一条线程对其进行lock操作,lock和unlock必须成对出现
- 如果对一个变量执行lock操作,将会清空工作内存中此变量的值,在执行引擎使用这个变量前需要重新执行load或assign操作初始化变量的值
- 如果一个变量事先没有被lock操作锁定,则不允许对它执行unlock操作;也不允许去unlock一个被其他线程锁定的变量。
- 对一个变量执行unlock操作之前,必须先把此变量同步到主内存中(执行store和write操作)。
12.1.3 重排序
在执行程序时为了提高性能,编译器和处理器经常会对指令进行重排序。重排序分成三种类型:
1.编译器优化的重排序。编译器在不改变单线程程序语义放入前提下,可以重新安排语句的执行顺序。
2.指令级并行的重排序。现代处理器采用了指令级并行技术来将多条指令重叠执行。如果不存在数据依赖性,处理器可以改变语句对应机器指令的执行顺序。
3.内存系统的重排序。由于处理器使用缓存和读写缓冲区,这使得加载和存储操作看上去可能是在乱序执行。
从Java源代码到最终实际执行的指令序列,会经过下面三种重排序:
为了保证内存的可见性,Java编译器在生成指令序列的适当位置会插入内存屏障指令来禁止特定类型的处理器重排序。Java内存模型把内存屏障分为LoadLoad、LoadStore、StoreLoad和StoreStore四种:
12.1.4 对于volatile型变量的特殊规则
volatile修饰变量只能保证变量对所有线程的可见性,在不符合以下两条规则的场景中,我们仍要通过加锁来保证原子性:
1.运算结果并不依赖变量的当前值,或者能够确保只有单一的线程修改变量的值。
2.变量不需要与其他的状态变量共同参与不变约束。volatile修饰变量是禁止指令重排序
12.1.5 原子性、可见性与有序性
原子性:由Java内存模型来直接保证的原子性变量操作包括read、load、assign、use、store和write, 除long和double,其他基本数据类型访问和读写都是原子性的, synchronized块之间的操作也是原子性的。
可见性:是指当一个线程修改了共享变量的值,其他线程能够立即得知这个修改。volatile、final、synchronized能实现可见性
有序性: 如果在本线程内观察,所有的操作都是有序的,如果在一个线程中观察另外一个线程,所有的操作都是无序的。前半句是指“线程内表现为串行的语义” , 后半句是指“指令重排序” 现象和 “工作内存与主存同步延迟”现象, volatile、synchronized能实现有序性
12.1.6 Happens-Before规则
它是判断数组是否存在竞争、线程是否安全的主要依据。依靠这个原则,我们可以通过几条规则一揽子解决并发环境下两个操作之间是否可能存在冲突的所有问题.
Happens-Before规则是Java内存模型中定义的两项操作之间的偏序关系,如果说操作A先行发生于操作B,其实就是说发生在操作B之前,操作A产生的影响能不操作B观察到,"影响"包括修改了内存中共享的值、发送了消息、调用了方法等。
- 程序次序规则:在一个线程内,应该按照控制流程顺序。
- 管程锁定规则:一个unlock操作先行发生于后面对用一个锁的lock操作。
- volatile变量规则:对一个volatile变量的写操作先行发生于后面对这个变量的读操作。
- 对象终结规则:一个对象的初始化完成先行发生于它的finalize()方法。
- 传递性:A先行发生于B,B先行发生于C,那么A一定先行发生于C。
- 线程启动规则:start()方法先行发生于此线程的每一个动作。
- 线程终止规则:线程中所有操作都先行发生于对此线程的终止检测。
- 线程中断规则:interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生。
12.2 Java与线程
12.2.1 线程的实现
1. 使用内核线程实现
内核线程(Kernel-Level Thread)就是直接由操作系统内核支持的线程,这种线程由内核来完成线程切换,内核通过操纵调度器对线程调度,并负责将线程的任务映射到各个处理器上。
优势:内核控制
劣势:线程切换需要系统调用,代价较高
2. 使用用户线程实现
狭义的用户线程指完全建立在用户空间的线程库上,系统内核不能感知线程存在的实现,
优势:是不用切换到内核态,消耗资源少,
劣势:线程的创建,切换和调度都是需要用户程序自己考虑,非常复杂。
3. 使用用户线程加轻量级进程混合实现
将内核线程与用户线程一起使用的方式,许多UNIX系列的操作系统都提供此模型
优势:消耗资源少,使用方便。
4. Java线程的实现
JDK1.2之前,是基于称之为“Green Threads”的用户线程实现,JDK1.2中线程模型替换为基于操作系统原生线程模型来实现。
12.2.2 Java线程调度
线程调度是指系统为线程分配处理器使用权的过程,主要调度方式有两种:协同式线程调度 和抢占式线程调度
协同式线程调度
线程执行时间由线程本身来控制,线程把自己工作执行完毕后,主动通知系统切换到另外一个线程上。
优势:实现简单,且没有线程同步问题。
劣势:线程执行时间不可控,导致阻塞。抢占式线程调度
每个线程由系统分配执行时间,线程切换不由线程本身来决定。(Java使用的线程调度)
优势:线程执行时间可控,不会因一个线程阻塞导致整个系统进程阻塞
Java语言一共设置了10个级别的线程优先级,但是线程是映射到操作系统原生线程上,并不见得与java优先级一一对应
12.2.3 状态转换
Java语言定义了5中线程状态,在任意个时间点,一个线程只能有一种状态。
新建(New):新建后没有启动
运行(Runable):有可能在运行,有可能在等待CPU分配时间。
无限期等待(Waiting):不会被分配CPU执行时间,要等待被其他线程显示的唤醒.
Object.wait()方法
Thread.join()方法
LockSupport.park()方法限期等待(Timed Waiting):不会被分配CPU执行时间,不需要等待被其他线程显示的唤醒.
Thread.sleep();
设置Timeout参数的Object.wait()方法
设置Timeout参数的Thread.join()方法
LockSupport.parkNanos()方法
LockSupport.parkUntil()方法阻塞(Block):线程进入同步区的时候进入此状态
结束(Terminated):线程执行完毕