计算机系统的一致性
在现代计算机操作系统中,多任务处理几乎是一项必备的功能,因为嵌入了多核处理器,计算机系统真正做到了同一时间执行若干个任务,是名副其实的多核系统。在多核系统中,为了提升CPU与内存的交互效率,一般都设置了一层 “高速缓存区” 作为内存与处理器之间的缓冲,使得CPU在运算的过程中直接从高速缓存区读取数据,一定程度上解决了性能的问题。但是,这样也带来了一个新问题,就是“缓存一致性”的问题。比如,多核的情况下,每个处理器都有自己的缓存区,数据如何保持一致性。针对这个问题,现代的计算机系统引入多处理器的数据一致性的协议,包括MOSI、Synapse、Firely、DragonProtocol等。
当处理器通过高速缓存区与主内存发生交互时,对数据的读写必须遵循协议规定的标准,用一张关系图表示的话大概如下:
而Java的内存模型 (JMM) 可以说与硬件的一致性模型很相似,采用的是共享内存的线程通信机制。
Java内存模型
Java内存模型规定了所有的变量都存储在主内存中,每个线程拥有自己的工作内存,工作内存中保存了被该线程使用的变量的主内存副本拷贝,线程只能操作自己工作内存的变量副本,操作完变量后会更新到主内存,通过主内存来完成与其他线程间变量值的传递。此模型的交互关系如下图所示:
然而,Java的内存模型只是反映了虚拟机内部的线程处理机制,并不保证程序本身的并发安全性。
举一个例子,在程序中对一个共享变量做自增操作:
i++;
假设初始化的时候i=0,当跑到此程序时,线程首先从主内存读取i的值,然后复制到自己的工作内存,进行i++操作,最后将操作后的结果从工作内存复制到主内存中。如果是两个线程执行i++的程序,预期的结果是2。但真的是这样吗?答案是否定的。
假设线程1读取主内存的i=0,复制到自己的工作内存,在进行i++的操作后还没来得及更新到主内存,这时线程2也读取i=0,做了同样的操作,那么最终得到的结果为1,而不是2。
这是典型的关于多线程并发安全例子,也是Java并发编程中最值得探讨的话题之一,一般来说,处理这种问题有两种手段:
- 加锁,比如同步代码块的方式。保证同一时间只能有一个线程能执行i++这条程序。
- 利用线程间的通信,比如使用对象的wait和notify方法来。
因为本文主要是探究 JMM 和 volatile 关键字的知识,具体怎么实现并发处理就不做深入探讨了,改天看看抽个时间再写篇博文专门讲解好了。
内存模型的3个重要特征
初步了解完什么是JMM后,我们来进一步了解它的重要特征。值得说明的是,在Java多线程开发中,遵循着三个基本特性,分别是原子性、可见性和有序性,而Java的内存模型正是围绕着在并发过程中如何处理这三个特征建立的。
原子性
原子性是指操作是原子性的,不可中断的。举个例子:
String s="abc";
这个操作是直接赋值,是原子性操作。而类似下面这段代码就不是原子性了:
i++;
当执行i++时,需要先获取i的值,然后再执行i+1,相当于包含了两个操作,所以不是原子性。
可见性
可见性是指共享数据的时候,一个线程修改了数据,其他线程知道数据被修改,会重新读取最新的主存的数据。就像前面说的两个线程处理i++的问题,线程1改完后没有更新到主内存,所以线程2是不知道的。
有序性
是指代码执行的有序性,对于一个线程执行的代码,我们可以认为代码是依次执行的,但并发中可能就会出现乱序,因为代码有可能发生指令重排序(Instruction Reorder),重排后的指令与原指令的顺序未必一致。
指令重排序
编译器能够自由的以优化的名义去改变指令顺序。在特定的环境下,处理器可能会次序颠倒的执行指令。是为指令的重排序,尤其是并发的情况下。
java提供了volatile和synchronized来保证线程之间操作的有序性。volatile含有禁止指令重排序的语义(即它的第二个语义),synchronized规定一个变量在同一时刻只允许一条线程对其lock操作,也就是说同一个锁的两个同步块只能串行进入。禁止了指令的重排序。
volatile关键字
说到了volatile,我们就有必要了解一下这个关键字是做什么的。
准确来说,volatile是java提供的轻量的同步机制。它有两个特性:
- 保证修饰的变量对所有线程的可见性。
- 禁止指令的重排序优化。
保证可见性和防止指令重排
简单写段代码说明一下:
public class VolatileDemo {
private static boolean isReady;
private static int number;
private static class ReaderThread extends Thread{
@Override
public void run() {
while (!isReady);
System.out.println("number = "+number);
}
}
public static void main(String[] args) {
new ReaderThread().start();
try {
Thread.sleep(1000);
number = 42;
isReady = true;
Thread.sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
在上面的代码中,ReaderThread
只有在isReady
为 true 时才会打印出 number
的值,然而,真实的情况有可能是打印不出来(可能性比较小,但还是有),因为线程ReaderThread线程无法看到主线程中对isReady
的修改,导致while循环永远无法退出,同时,因为有可能发生指令重排,导致下面的代码不能按顺序执行:
number = 42;
isReady = true;
也就是能打印的话,number值可能是0,不是42。如果在变量加上volatile关键字,告诉Java虚拟机这两个变量可能会被不同的线程修改,那么就可以防止上述两种不正常的情况的发生。
不能保证原子性
volatile能保证可见性和有序性,但无法保证原子性,比如下面的例子:
public class VolatileDemo {
public static volatile int i = 0;
public static void increase() {
i++;
}
public static void main(String[] args) throws InterruptedException {
VolatileDemo test = new VolatileDemo();
for (int i = 0; i < 10; i++) {
new Thread(() -> {
for (int j = 0; j < 1000; j++)
test.increase();
}).start();
}
Thread.sleep(1000);
System.out.println(test.i);
}
}
正常情况下,我们期望上面的main函数执行完后输出的结果是10000,但你会发现,结果总是会小于10000,因为increase()方法中的i++
操作不是原子性的,分成了读和写两个操作。假设当线程1读取了 i 的值,还没有修改,线程2这时也进行了读取。然后,线程1修改完了,通知线程2重新读取 i 的值,可这时它不需要读取 i,它仍执行写操作,然后赋值给主线程,这时数据就会出现问题。
所以,一般针对共享变量的读写操作,还是需要用锁来保证结果,例如加上 synchronized关键字。
参考:
《Java高并发程序设计》
《深入理解Java虚拟机》