一、概述
在当前的Java内存模型下,每个线程都拥有自己的工作内存,在进行变量的操作之前,每个线程会先把要使用的变量从主内存读入到自己的工作内存,当对该变量操作完成后(如i++操作),再将该变量写会主内存,这就可能造成一个线程在主存中修改了一个变量的值,而另外一个线程还继续使用它在寄存器中的变量值的拷贝,造成数据的不一致,volatile关键字就是为了解决在并发编程的条件下数据不一致的问题。
二、三个概念
- 原子性
由Java内存模型来直接保证的原子性操作包括read 、load、use、assign、store、write这六个,我们大致可以认为基本数据的访问读写操作是具备原子性的(long和double类型的读写操作也基本都实现了原子操作)。 - 可见性
可见性是指当多个线程访问同一个共享变量时,一个线程改变了这个变量的值,其他线程能够立即感知到该变量的变化; - 指令重排序
一般来说,处理器为了提高程序运行效率,可能会对输入代码进行优化,它不保证程序中各个语句的执行先后顺序同代码中的顺序一致,但是它会保证程序最终执行结果和代码顺序执行的结果是一致的。
三、特点
- volatile关键字只能用来修饰变量。
- volatile变量是一种比synchronized关键字较轻量级的同步机制,也可以说是Java虚拟机提供的最轻量级的同步机制,在访问volatile变量时不会执行加锁操作,也不会造成线程的阻塞,被volatile修饰的成员变量,在各个线程的私有工作内存中不存在它的私有拷贝,各个线程在访问该变量前必须从主存(共享内存)中读取该变量的值。
- Java内存模型是通过将在工作内存中的变量修改后的值同步到主内存(共享内存),即原子操作(assgin-store-write)必须依次执行,在读取变量前从主内存(共享内存)刷新最新值到工作内存中来实现可见性的。
- volatile关键字保证了被它修饰的变量值修改后立即同步到主内存,每次使用该变量前都从主内存中刷新,即被volatile修饰的变量对所有的线程是可见的,对volatile变量的所有的写操作都能立即反映到其他线程中。
- 被volatile关键字修饰的变量不允许进行指令的重排序。
- volatile关键字只能保证共享变量的可见性,只能保证不同线程每次访问该共享变量时读取的是该变量的最新值,但不能保证对变量的操作的原子性。
- volatile关键字无法保证操作的原子性,通常来说,使用volatile关键字必须具备以下2个条件:
①对变量的写操作不依赖当前值,或者能够确保只有单一的线程修改变量的值。
②该变量没有包含在具有其他变量的不变式中,或者说变量不需要与其它的状态变量共同参与不变约束。
以上条件说明,n++,n--这些非原子操作不能保证volatile关键字修饰的变量在并发条件下值的正确性,而只有n=m+1,n=5,这些原子操作才能保证该变量在并发环境下值的正确性。
来看一个例子:
public class Test {
public volatile int inc = 0;
public void increase() {
inc++;
}
public static void main(String[] args) {
final Test test = new Test();
for(int i=0;i<10;i++){
new Thread(){
public void run() {
for(int j=0;j<1000;j++)
test.increase();
};
}.start();
}
while(Thread.activeCount()>1) //保证前面的线程都执行完
Thread.yield();
System.out.println(test.inc);
}
}
变量inc声明为volatile int类型,保证了所有线程对变量inc的可见性,按照我们的目的,最后的输出结果应该为10*1000=10000,然而最后的结果均小于10000,且每次运行的结果不一,难道volatile修饰的变量的可见性特征失效了?不,volatile变量只能保证共享变量对所有线程的可见性,从Java内存模型的角度理解:被volatile关键字修饰的变量只能保证assgin->store->write操作和read->load->use操作的原子性,但inc++操作包括的原子操作有:read->load->use->assgin->store->write操作,所以自加操作并非一个原子操,线程A在读取到inc的最新值之后,在assgin操作之前可能切换到线程B,线程B此时执行的操作可能为read->load->use->assgin->store->write操作,完成了inc的自加操作,此时线程A由于已经读取到inc的值,所以不再从主存中刷新inc的值,但此时线程A的工作内存中保存的inc的值已经过期,线程A对过期的inc值进行自加操作后写会了主内存,从而造成数据的错误。
注:以上是属于个人理解,可能存在不严谨之处,也可以从JVM反编译字节码的角度来解释该原因,可参见《深入理解Java虚拟机》第十二章:Java内存模型与线程;