线程安全
多线程程序处于一个多变的环境中时,可以访问到全局的变量和堆数据,加上每个线程都可以访问,而且这种访问基本上都是乱序的。而且基本上我们在用任何一门语言写的一条代码,被编译为汇编代码后,都不止一条指令。在指令访问的时候,经常就会出现时序上的问题,从而导致数据不安全。对于一个寄存器来说,很可能面对的情况就如下图所示
这情况有可能是调度系统引起的,也有可能是多个CPU执行引起的。也就是在说在第一条代码执行的过程中第二条代码也开始执行,第一条代码被打断。当然上个例子是在第一条代码指令3的时候被第二代码指令1抢先一步执行所出现的情况,其它情况有兴趣可以自行整理下。整理完了,我们就会发现指令似乎被我们当成了一个具备原子性的操作单元,因为它不会被打断,在实际的计算机执行过程中也是如此。单指令的操作就成为原子操作(Atomic),为了避免上述那些错误,操作系统都会提供一套原子操作的API。
同步与锁
为了避免多个线程同时读写同一个数据而产生不可预估的结果,就需要将各个线程对同一个数据的访问进行同步(Synchronization)。同步是让在一个线程访问数据结束之前,不允许其它线程对同一个数据进行访问。因此,对数据的访问被原子了。简单点来说,就是如果要访问这个同步了的数据的话,你们线程就排队来操作。
同步最常见的方法就是使用锁(Lock)。锁是一种非强制机制,每个线程在访问数据或者资源之前首先试图获取(Acquire)锁,,并在访问结束之后释放(release)锁。在锁已经被占用的时候试图获取锁时,线程会等待,直到锁重新可用。
二元信号量(binary semaphore)是最简单的一种锁,它只有两种状态:占用和非占用。适合只能被唯一一个线程独占访问的资源。当二元信号量处于非占用状态时,第一个试图获取该二元信号量的线程会获得该锁,并将二元信号量置为占有状态,此后其它的所有试图获取该二元信号量的线程将会等待,直到该锁被释放。
对于允许多个线程并发访问的资源,多元信号量简称信号量(semaphore),它是一个很好的选择。一个初始值为N的信号量允许N个线程并发访问。线程访问资源的时候首先获取信号量,会将信号量的值减1,直至信号量的值小于0,进入等待状态,否则继续执行。等线程访问资源后,线程会释放信号量,将信号量加1,如果信号量小于1,唤醒一个等待中的线程。
互斥量(Mutex)和二元信号量相似,资源仅同时允许一个线程访问,但和信号量不同的是,信号量在整个系统可以被任意线程获取并释放,也就是说,同一个信号量可以被系统中的一个线程获取之后由另一个线程释放。而互斥量则要求哪个线程获取了互斥量,哪个线程就要负责释放这个锁,其它线程去释放这个锁的话是无效的。
临界区(Critical Section)是比互斥量更加严厉的同步手段。在术语中,把临界区的锁的获取称为进入临界区,而把锁的释放称为离开临界区。临界区和互斥量与信号量的区别在于,互斥量和信号量在系统的任务进程里都是可见的,也就是说,一个进程创建了一个互斥量或信号量,另一个进程试图去获取该锁都是合法的。然而,临界区的作用范围仅限于本进程,其它的进程无法获取该锁。除此之外,临界区有和互斥量相同的性质。
读写锁(Read-Write Lock)致力于一种更加特定的场合的同步。对于一段数据,多个线程同时读取总是没有问题的,但假设操作都不是原子的,只要有任何一个线程试图对这个数据进行修改,就必须使用同步手段来避免出错。如果我们使用上述的信号量,互斥量或者临界区中的任何一种来进行同步,尽管能保证程序的正确性,但由于读取频繁、而仅仅偶尔写入的情况,每次读取也要进行锁的获取和释放,就会变得很低效。读写锁可以避免这个问题。对于同一个锁,读写锁有两种获取方式,共享的(Shared)或独占的(Exclusive)。
当锁处于自由的状态时,试图以任何一种方式获取锁都能成功,并将锁置于对应的状态(共享或者是独占)。
如果锁处于共享状态,其它的线程以共享的方式获取锁仍然会成功,此时这个锁分配给了多个线程。然而,如果其它的线程以独占的方式去获取该处于共享状态的锁,那么它必须等所有持有锁的线程释放掉该锁,才能获取到并将此锁置于独占状态。
处于独占状态的锁将阻止任务其它线程获取该锁,不论它们以什么方式获取。
条件变量(Condition Variable)作为一种同步手段,作用类似一个栅栏。对于条件变量,线程可以有两种操作,1、首先线程可以等待条件变量,2、线程可以唤醒条件变量。刚刚我们也说过条件变量的作用类似一个栅栏,栅栏有“关”和“开”两种状态。
当“关”的状态时,一个条件变量可以被多个线程等待。
“关”到“开”的状态变化过程中,某个线程中执行代码达到了某个条件,导致此线程唤醒了条件变量。
到“开”的状态时,所有等待此条件变量的线程都会被唤醒并执行。
所以,总归来说,使用条件变量可以让复数个线程一起等待某个时间的发生,当事件发生时,所有线程恢复执行。