参考资料:《Java高并发程序设计》
1.几个概念
1.同步和异步
- 同步和异步一般用来形容
一次方法调用
。 -
同步
:同步方法调用一旦开始,调用者必须等到方法调用返回后,才能继续后续的行为。 -
异步
:异步方法调用更像一个消息传递
,一旦开始,方法调用就会立即返回
,调用者就可以继续后续的操作。而异步方法通常会在另一个线程
中去执行。如果异步调用需要返回结果,那么当这个异步调用真实完成后,则会通知
调用者。
2.并发和并行
- 并发和并行都可以表示两个或多个任务
一起执行
,但偏重点有所不同。 -
并发
:偏重于多个任务交替执行
,而多个任务之间有可能还是串行
的。 -
并行
:是真正意义上的同时执行
。 - 如果系统只有一个CPU,那么只可能是并发不可能是并行。真实的并行只会出现在拥有多个CPU的系统中。
3.临界区
-
临界区
用来表示一种公共资源
或者说是共享数据
,可以被多个线程使用。但是每一次,只能有一个线程使用它。
4.阻塞和非阻塞
- 阻塞和非阻塞通常用来形容多线程间的
相互影响
。 -
阻塞
:比如一个线程占用了临界区
资源,那么其他所有需要这个资源的线程就必须在这个临界区中进行等待
。等待会导致线程挂起
,这种情况就是阻塞。 -
非阻塞
:它强调没有一个线程可以妨碍其他线程执行,所有的线程都会尝试
不断向前执行。
5.死锁、饥饿和活锁
- 死锁、饥饿和活锁都属于多线程的
活跃性问题
。 -
死锁
:两个或多个线程间互相持有着对方所需要的资源,如果所有线程都不会释放自己占用的资源,那么这个状态将永远维持下去,谁都不可能通过。 -
饥饿
:一个或多个线程因为种种原因无法获得所需的资源,导致一直无法执行。比如程序优先级
可能太低,或者另一个线程一直占着关键资源
不放。 -
活锁
:如果线程不够智能,且都秉承着谦让
的原则,主动将资源释放给他人使用,那么就会出现资源不断在两个线程中跳动
,而没有一个资源可以同时拿到所有资源去正常执行。
2.并发级别
- 由于
临界区
的存在,多线程之间的并发必须受到控制
,根据控制并发的策略
,可以把并发的级别
进行分类:
1.阻塞
- 如果一个线程是阻塞的,那么在其他线程释放资源之前,当前线程无法继续执行。
- 当使用
synchronized
关键字,或者重入锁
时,我们得到的就是阻塞
的线程。
2.无饥饿
- 如果线程之间是有
优先级
的,那么线程调度
的时候总是会倾向于满足高优先级的线程。即对于同一个资源的分配,是不公平
的。 - 如果锁是公平的,满足
先来后到
,那么饥饿就不会产生,所有线程都有机会执行。
3.无障碍
-
无障碍
是一种最弱
的非阻塞调度
。 -
阻塞
的控制方式是悲观策略
,即系统认为两个线程之间很有可能发生不幸的冲突
,因此,以保护共享数据为第一优先级。 -
非阻塞
的调度是一种乐观策略
,它认为多个线程之间很有可能不会发生冲突
,或者说概率不大
,因此大家都应该无障碍
的执行。但如果一旦检测到冲突,就应该进行回滚
。 - 如果当临界区存在
严重冲突
时使用此策略,有可能会导致所有线程都不断回滚
自己的操作,而没有一个线程可以走出临界区。 - 一种可行的无障碍
实现
可以依赖一个一致性标记
来实现。线程在操作之前,先读取并保存
这个标记,在操作完成后,再次读取
,检查这个标记是否被更改
过,如果先后两次读取到的数据一致
,说明资源访问没有冲突
。如果不一致,则说明资源可能在操作过程中与其他写线程
冲突,需要重试
操作。而任何对资源有修改操作
的线程,在修改数据前,都需要更新
这个一致性标记,表示数据已不安全。
4.无锁
-
无锁
的并行都是无障碍
的。不同的是,无锁的并发必然有一个线程
能够在有限步内
完成操作离开临界区
。 - 在无锁的调用中,一个典型的特点是可能会包含一个
无穷循环
。在这个循环中,线程会不断尝试
修改共享变量。如果没有冲突,修改成功,那么程序退出,否则继续尝试修改。如果运气不好,总是尝试不成功,则会出现类似饥饿
的现象,线程会停止不前。 - 一段无锁的示意代码:
while(!atomicVar.compareAndSet(localVar, localVar + 1)){
localVar = atomicVar.get();
}
5.无等待
-
无锁
只要求有一个线程
可以在有限步内完成操作,而无等待
则要求所有线程
都必须在有限步内完成,这样就不会
引起饥饿
问题。 - 如果限制
循环次数
,还可以进一步分解为有界无等待
和线程数无关的无等待
几种,它们的区别只是对循环次数的限制不同。 - 一个典型的无等待结构就是
RCU
(Read-Copy-Update)。它的基本思想是:对数据的读可以不加控制,因此所有的读线程都是无等待的,它们既不会被锁定等待也不会引起任何冲突。但在写数据的时候,先取得原始数据的副本
,接着只修改副本数据(这就是为什么读可以不加控制),修改完成后,在合适的时机回写数据
。
3.原子性、可见性、有序性
1.原子性
-
原子性
是指一个操作是不可中断
的。即一个操作一旦开始,在结束之前不会被其他线程干扰
。 - 反例:
32位系统
中long型
数据的读和写都不是原子性的,多线程之间会相互干扰。
2.可见性
-
可见性
是指当一个线程修改了某一个共享变量
的值,其他线程是否能够立即感知
到这个修改。 - 反例:缓存优化、硬件优化、编译器优化(指令重排)
3.有序性
-
有序性
是指多线程间,代码实际执行的顺序
和代码在源文件中出现的顺序
语义一致的特性。 - 反例:
指令重排
。
4.指令重排
-
指令重排
是为了尽量减少流水线
的中断
,从而提高性能
。 - 指令重排可以保证串行语义一致,但不能保证多线程间的语义也一致。
- 不能进行重排的指令:
Happen-Before原则
- 程序顺序原则:一个线程内保证语义的串行性
- volatile规则:volatile变量的写,先发生于读,这保证了volatile变量的可见性
- 锁规则:解锁必然发生在随后的加锁前
- 传递性:A先于B,B先于C,那么A必然先于C
- 线程的start()方法先于它的每一个动作
- 线程的所有操作先于线程的终结
- 线程的中断先于被中断线程的代码
- 对象的构造函数执行、结束先于finalize()方法
4.线程的基础知识
1.进程和线程的关系
-
进程
是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础。 -
线程
是轻量级进程,是程序执行的最小单位。使用多线程而不是多进程去进行并发程序的设计,是因为线程间的切换和调度的成本远小于进程。 - 进程是线程的
容器
。
2.线程的状态图
- 线程的所有
状态
都在Thread的State枚举中定义:
public enum Statue{
NEW,
RUNNABLE,
BLOCKED,
WAITING,
TIMED_WAITING,
TERMINATED;
}
-
线程状态图:
- NEW:表示
刚刚创建
的线程,这种线程还没有开始执行
。 - RUNNABLE:表示线程所需的一切
资源
都已经准备好了,线程正在执行
。 - BLOCKED:表示线程
暂停执行
,直到获得请求的锁
。 - WAITING:进入一个
无时限
的等待
。 - TIMED_WAITING:进入一个
有时限
的等待
。 - TERMINATED:表示线程执行完毕,线程
结束
。
end