volatile
是Java虚拟机提供的最轻量级的同步机制,用于保证共享变量在多线程之间的可见性。谈以下几点体会:
1. 可见性是如何保证的?
cpu访问内存中的数据,会先加载到自身的缓存,再从缓存中加载数据,处理后,会再次写入到缓存。为了优化cpu的处理能力,缓存中的数据,可能不会第一时间写入到主存,方便cpu对数据的频繁访问。
用volatile
关键字修饰的变量,会在cpu处理完成后,第一时间刷新到主存,保证其他线程能在第一时间读取到变量的变化。
刷新是如何实现的呐?
通过分析对volatile修饰的变量进行写操作的汇编代码,可以发现Lock前缀指令,该指令在多核处理器有两个作用:
- 将当前处理器缓存行的数据写回到系统内存(执行指令期间,可以独占内存,通过锁缓存或是总线)
- 这个写回操作会使其他cpu里缓存了该内存地址的数据无效,即读取该变量时需要从主存重新读取变量到缓存,给cpu使用(通过缓存一致性协议保证,相关内容后续补充)
2. volatile关键字并不一定保证并发安全
volatile
关键字只能保证所有线程在同一时间,看到的变量值是唯一的。即只有对volatile
修饰的变量进行原子性操作,才会保证一个线程写操作变量后,立即刷新到主存,其他线程会等候读取到。原子性操作比如:
public volatile int a = 0;
//原子操作
public void set(int input){
a = input;
}
但如果针对volatile
修饰的变量进行非原子性操作(例如i++
,自增运算在class文件中,是由四条字节码组成的,底层可能由更多条机器指令组成,并非原子操作),其他线程就由可能在此期间访问到这个变量,导致变量在各线程中不一致,从而导致线程的不安全。这并不违背volatile
变量的语义规范。示例如下:
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
/**
* Created by che on 2017/4/14.
*/
public class VolatileTest implements Runnable {
private static volatile int in = 0;
public static void increament(){
in++;
}
public void run(){
for(int i = 0; i < 1000; i++){
increament();
}
}
public static void main(String[] args) {
ExecutorService executorService = Executors.newCachedThreadPool();
for(int i = 0; i < 20; i++){
executorService.execute(new VolatileTest());
}
executorService.shutdown();
System.out.println(in);
}
}
程序中想证明的是,用20个线程来做自增操作,每个线程自增1000次,如果并发安全,in
的值应为20000,实际运行结果均小于20000。原因就是increament()
操作并非原子操作,可以使用synchronized
关键字来保证区块的原子性,即在上文中做这样的修改:
public synchronized static void increament(){
in++;
}
3. volatile 对指令重排序的影响
重排序是指编译器和处理器为了优化程序性能而对指令进行的重新排序,通俗来讲,就是我们按顺序写的代码,编译器和处理器会进行优化,因而变的无序。虽然顺序变了,但在单线程的执行背景下,是会获得一致性的结果的。但在多线程的条件下,就可能产生错误。
而volatile
变量,会通过对其读/写操作时,分别加入不同的内存屏障,来影响重排序的发生,JMM的保守策略如下:
- volatile写操作前插入StoreStore屏障
- volatile写操作后插入StoreLoad屏障
- volatile读操作后插入LoadLoad屏障
- volatile读操作后插入LoadStore屏障
注:X86处理器仅会对写--读操作做重排序,不会对读--读、读--写、写--写操作重排序,因此只需要插入一个StoreLoad。这意味着在X86处理器中,volatile写的开销比volatile读的开销会大很多(因为执行StoreLoad屏障开销会比较大)。
4. volatile与synchronized的选择
volatile
是轻量级的同步机制,相对而言,synchronized
是一种锁的机制,对底层的JVM优化限制更多,性能会下降。如果并发编程经验不足或对并发场景认识不足,建议使用synchronized
,毕竟安全远大于性能。
「此部分待后续补充」
Reference:
《深入理解Java虚拟机》
《Java并发编程艺术》