更多 Java 并发编程方面的文章,请参见文集《Java 并发编程》
进程 VS 线程
- 进程 Process:资源组织的基本单位
- 线程 Thread:CPU 调度的基本单位,包括程序计数器,寄存器,栈,帧
可见性
单线程程序中的可见性
在单线程程序中,如果首先改变一个变量的值,再读取该变量的值的时候,所读取到的值就是上次写入的值。
也就是说,前面操作的结果对后面的操作是可见的。
多线程程序中的可见性
在多线程程序中,可能不能保证可见性,原因如下:
-
CPU 内部的缓存
CPU 直接操作的是缓存中的数据,并不是直接操作主存。CPU 会在特定的时候,将缓存与主存进行同步。
例如:
CPU 将数据从主存同步到缓存,线程1从缓存中读取数据并修改,将修改后的数据写入到缓存,并未同步到主存。而此时线程2从主存中读取数据,这时线程2读取到的数据并不是线程1修改后最新的数据。因此这就导致了不可见。 - CPU 可能会改变指令的执行顺序,即指令重排
- 处于性能优化的目的,编译器可能会改变代码的顺序,即代码重排
在 Java 中:
- 堆内存在线程间共享,存在可见性问题
- 栈内存在线程间不共享,不存在可见性问题
重排序
Java 内存模型
- Java 内存模型描述了程序中共享变量的关系以及在主存中写入和读取这些变量的底层细节。
- 定义了 synchronized,volatile,final 等关键字
- Java 开发人员使用这些关键字来描述程序所期望的行为
- 编译器和 JVM 负责保证生成的代码在运行时的行为符合期望,符合 Java 内存模型的描述
- 定义了 happens - before 的顺序
- 如果一个动作按照 happens - before 的顺序发生在另一个动作之前,那么前一个动作的结果在多线程的情况下对后一个动作肯定是可见的。
- 例子:对一个对象上的监听器 monitor 的 解锁操作 肯定发生在 加锁操作 之前。
- 例子:对 volatile 变量的 写操作 肯定发生在 读操作 之前。
Java 内存模型如下图所示:
注意: 线程的本地内存是 JVM 的一个抽象概念,并不真实存在。
同步
并发编程中需要关注的两点:
- 线程间的通信:共享内存,消息传递
- 线程间的同步:控制不同线程间操作的顺序
在共享内存的并发模型中,例如 Java,线程间的同步是显式的,需要程序员显示指定。
在消息传递的并发模型中,线程间的同步是隐式的,不需要程序员显示指定,因为消息的发送必须在消息的接收之前。