写在前面
通过上一篇的学习我们对多线程有了比较深入的了解,在使用多线程的时候,我们为了保证线程安全会使用锁,那么这篇呢.我们就来探究一下锁的使用原理
一、锁
① 锁的性能
借鉴一张锁的性能数据对比图,如下所示从上图我们可以知道锁的性能从高到底依次为:OSSpinLock(自旋锁) -> dispatch_semaphone(信号量) -> pthread_mutex(互斥锁) -> NSLock(互斥锁) -> NSCondition(条件锁) -> pthread_mutex(recursive 互斥递归锁) -> NSRecursiveLock(递归锁) -> NSConditionLock(条件锁) -> synchronized(互斥锁)
② 锁的归类
结合上图锁大致分为以下几类:
②.1 自旋锁
在自旋锁中,线程会反复检查变量是否可用
.由于线程在这个过程中一致保持执行,所以是一种忙等待
. 一旦获取了自旋锁,线程就会一直保持该锁
,直到显式释放自旋锁
.自旋锁
避免了进程上下文的调度开销,因此对于线程只会阻塞很短时间的场合
是有效的.对于iOS
属性的修饰符atomic
,它自带一把自旋锁.
OSSpinLock
atomic
②.2 互斥锁
互斥锁
是一种用于多线程编程
中,防止两条线程同时对同一公共资源
(例如全局变量)进行读写的机制
,该目的是通过将代码切成一个个临界区
而达成.当获取锁操作失败时,线程会进入睡眠,等待锁释放时被唤醒
pthread_mutex
NSLock
@synchronized
②.3 条件锁
条件锁
就是条件变量
,当进程的某些资源要求不满足
时就进入休眠
,即锁住了,当资源被分配到了,条件锁打开了,进程继续运行
NSCondition
NSConditionLock
②.4 递归锁
递归锁
就是同一个线程可以加锁N次而不会引发死锁
.递归锁是特殊的互斥锁
,即是带有递归性质的互斥锁
pthread_mutex(recursive)
NSRecursiveLock
②.5 信号量
信号量
是一种更高级的同步机制
,互斥锁
可以说是semaphore在仅取值0/1时的特例
,信号量可以有更多的取值空间,用来实现更加复杂的同步
,而不单单是线程间互斥
dispatch_semaphore
②.6 读写锁
读写锁
实际是一种特殊的自旋锁
,它把对共享资源的访问者划分成读者和写者,读者只对共享资源进行读访问,写者则需要对共享资源进行写操作.这种锁相对于自旋锁
而言,能提高并发性,因为在多处理器系统中,它允许同时有多个读者来访问共享资源,最大可能的读者数为实际的CPU数
- 写者是排他性的,⼀个读写锁同时只能有⼀个写者或多个读者(与CPU数相关),但不能同时既有读者⼜有写者.在读写锁保持期间也是抢占失效的
- 如果读写锁当前没有读者,也没有写者,那么写者可以⽴刻获得读写锁,否则它必须⾃旋在那⾥,直到没有任何写者或读者.如果读写锁没有写者,那么读者可以⽴即获得该读写锁,否则读者必须⾃旋在那⾥,直到写者释放该读写锁.
- 一次只有一个线程可以占有写模式的读写锁, 但是可以有多个线程同时占有读模式的读写锁.正是因为这个特性,当读写锁是写加锁状态时, 在这个锁被解锁之前, 所有试图对这个锁加锁的线程都会被阻塞.当读写锁在读加锁状态时, 所有试图以读模式对它进行加锁的线程都可以得到访问权, 但是如果线程希望以写模式对此锁进行加锁, 它必须直到所有的线程释放锁.
- 当读写锁处于读模式锁住状态时, 如果有另外线程试图以写模式加锁, 读写锁通常会阻塞,随后的读模式锁请求, 这样可以避免读模式锁⻓期占用, 而等待的写模式锁请求⻓期阻塞.读写锁适合于对数据结构的读次数比写次数多得多的情况. 因为读模式锁定时可以共享, 以写模式锁住时意味着独占, 所以读写锁又叫共享-独占锁
②.7 总结
其实在iOS中锁的基本种类只有两种:互斥锁
、自旋锁
,其他的比如条件锁
、递归锁
、信号量
都是上层的封装和实现.
二、锁的细说
① OSSpinLock(自旋锁)
自从OSSpinLock
出现了安全问题,在iOS10
之后就被废弃了.自旋锁之所以不安全,是因为自旋锁由于获取锁时,线程会一直处于忙等待状态
,造成了任务的优先级反转.
而OSSpinLock
忙等的机制就可能造成高优先级一直running等待
,占用CPU时间片;而低优先级任务无法抢占时间片,变成迟迟完不成,不释放锁的情况
在OSSpinLock
被弃用后,其替代方案是内部封装了os_unfair_lock
,而os_unfair_lock
在获取锁操作失败时,线程会进入休眠状态
,而不是自旋锁的忙等状态
② atomic(原子锁)
atomic
适用于OC
中属性的修饰符,其自带一把自旋锁,但是这个一般基本不使用,都是使用的nonatomic
在前面的文章中,我们提及setter
方法会根据修饰符调用不同方法,其中最后会统一调用reallySetProperty
方法,其中就有atomic
和非atomic
的操作
从源码中可以看出,对于atomic
修饰的属性,进行了spinlock_t
加锁处理,但是在前文中提到OSSpinLock
已经废弃了,这里的spinlock_t
在底层是通过os_unfair_lock
替代了OSSpinLock
实现的加锁.同时为了防止哈希冲突
,还是用了加盐
操作
getter
方法中对atomic
的处理,同setter
是大致相同的
atomic只能保证setter、getter方法的线程安全,并不能保证数据安全
如上图所示,被atomic
修饰的index
变量分别在两次并发异步for循环10000
次后输出的结果并不等于20000
.由此可以得出结论:
-
atomic
保证变量在取值和赋值时的线程安全 - 但不能保证
self.index+1
也是安全的 - 如果改成
self.index=i
是能保证setter
方法的线程安全的
③ @synchronized(互斥递归锁)
@synchronized
可能是日常开发中用的比较多的一种互斥锁,因为它的使用比较简单,但并不是在任意场景下都能使用@synchronized
,且它的性能较低
接下来就通过源码探索来看一下@synchronized
在使用中的注意事项
- 通过
汇编
能发现@synchronized
就是实现了objc_sync_enter
和objc_sync_exit
两个方法
- 通过
clang
也能得到一些信息:
- 通过加
objc_sync_enter
符号断点,查看底层所在的源码库,通过断点发现在objc源码
中,即libobjc.A.dylib
③.1 objc_sync_enter & objc_sync_exit 分析
打开objc4-818.2
源码,搜索objc_sync_enter
- 如果
obj
存在,则通过id2data
方法获取相应的SyncData
,对threadCount
、lockCount
进行递增操作 - 如果
obj
不存在,则调用objc_sync_nil
,通过符号断点
得知,这个方法里面什么都没做,直接return
了
在objc4-818.2
源码中搜索objc_sync_exit
- 如果
obj
存在,则调用id2data
方法获取对应的SyncData
,对threadCount
、lockCount
进行递减操作 - 如果
obj
为nil
,什么也不做
通过上面两个实现逻辑的对比,发现它们有一个共同点,在obj
存在时,都会通过id2data
方法,获取SyncData
③.2 SyncData
进入SyncData
的定义,是一个结构体
,主要用来表示一个线程data
,类似于链表结构
,有next指向
,且封装了recursive_mutex_t
属性,可以确认@synchronized
确实是一个递归互斥锁
进入SyncCache
的定义,也是一个结构体
,用于存储线程
,其中list[0]
表示当前线程的链表data
,主要用于存储SyncData
和lockCount
③.3 id2data 分析
进入id2data
源码,从上面的分析,可以看出,这个方法是加锁和解锁
都复用的方法
- 1.首先在
tls
即线程缓存
中查找- 在
tls_get_direct
方法中以线程为key
,通过KVC
的方式获取与之绑定的SyncData
,即线程data
.其中的tls()
,表示本地局部的线程缓存
. - 判断
获取的data是否存在
,以及判断data
中是否能找到对应的object
. - 如果都找到了,在
tls_get_direct
方法中以KVC
的方式获取lockCount
,用来记录对象被锁了几次
(即锁的嵌套次数). - 如果
data
中的threadCount
小于等于0,或者lockCount
小于等于0时,则直接崩溃. - 通过传入的
why
,判断操作类型
- 如果是
ACQUIRE
,表示加锁
,则进行lockCount++
,并保存到tls
缓存. - 如果是
RELEASE
,表示释放
,则进行lockCount--
,并保存到tls
缓存.如果lockCount
等于0
,从tls
中移除线程data
. - 如果是
CHECK
,则什么也不做.
- 如果是
- 在
- 2.如果
tls
中没有,则在cache
缓存中查找。- 通过
fetch_cache
方法查找cache
缓存中是否有线程 - 如果有,则遍历
cache
总表,读取出线程对应的SyncCacheItem
- 从
SyncCacheItem
中取出data
,然后后续步骤与tls的匹配是一致
的
- 通过
- 3.如果
cache
中也没有,即第一次进来
,则创建SyncData
,并存储到相应缓存中- 如果在
cache
中找到线程,且与object相等
,则进行赋值
、以及threadCount++
- 如果在
cache
中没有找到,则threadCount
等于1
- 如果在
所以在id2data
方法中,主要分为三种情况:
- 1.第一次进来,没有锁
threadCount = 1
lockCount = 1
- 存储到
tls
- 2.不是第一次进来,且是同一个线程
-
tls
中有数据,则lockCount++
- 存储到
tls
-
- 3.不是第一次进来,且是不同线程
-
全局线程空间
进行查找线程 threadCount++
lockCount++
- 存储到
cache
-
③.4 tls和cache表结构
针对tls
和cache
缓存,底层的表结构如下所示
-
哈希表
结构中通过SyncList
结构来组装多线程
的情况 -
SyncData
通过链表
的形式组装
,记录当前可重入的情况
- 下层通过
tls线程缓存
、cache缓存
来进行处理 - 底层主要有两个东西:
lockCount
、threadCount
,解决了递归互斥锁
,解决了嵌套可重入
③.5 @synchronized 坑点
下面代码这样写,会有什么问题?
运行结果发现,运行就崩溃
崩溃的主要原因是testArray
在某一瞬间变成了nil
,从@synchronized
底层流程知道,如果加锁的对象成了nil
,是锁不住的,相当于下面这种情况,block
内部不停的retain
、release
,会在某一瞬间上一个还未release
,下一个已经准备release
,这样会导致野指针
的产生
我们发现确实出现过度释放
,出现野指针
.所以我们一般使用@synchronized (self)
,主要是因为_testArray的持有者是self
- 过度释放:对象已经不存在了,还进行
release
,即多次release
- 野指针:
指针指向
的对象已经被回收掉了,这个指针就叫做野指针.
解决方案:
- 对
self
进行同步锁,这个似乎太臃肿了 - 使用
NSLock
③.6 @synchronized 总结
-
@synchronized
在底层封装的是一把递归锁
,所以这个锁是递归互斥锁
-
@synchronized
的可重入
,即可嵌套
,主要是由于lockCount
和threadCount
的搭配 -
@synchronized
使用链表
的原因是链表方便下一个data的插入
- 但是由于
底层中链表查询
、缓存的查找以及递归
,是非常耗内存以及性能
的,导致性能低,所以在前文中,该锁的排名在最后 - 但是目前该锁的使用频率仍然很高,主要是因为
方便简单
,且不用解锁
- 不能使用
非OC对象
作为加锁对象
,因为其object
的参数为id
-
@synchronized (self)
这种适用于嵌套次数较少
的场景.这里锁住的对象也并不永远是self
,这里需要读者注意 - 如果
锁嵌套次数较多
,即锁self过多
,会导致底层的查找非常耗时
,因为其底层是链表进行查找
,所以性能较差
,此时可以使用NSLock
、信号量
等
④ NSLock
④.1 简单实用
NSLock
是对下层pthread_mutex
的封装,使用如下
直接进入NSLock
定义查看,其遵循了NSLocking
协议,下面来探索NSLock
的底层实现
通过加符号断点lock
分析,发现其源码在Foundation
框架中
由于OC
的Foundation
框架不开源,所以这里借助Swift
的开源框架Foundation来分析NSLock
的底层实现,其原理与OC
是大致相同的
通过源码实现可以看出,底层是通过pthread_mutex
互斥锁实现的.并且在init
方法中,还做了一些其他操作,所以在使用NSLock
时需要使用init
初始化
回到前文的锁性能图中,可以看出NSLock
的性能仅次于 pthread_mutex
(互斥锁),非常接近
NSLock
在AFNetworking
的AFURLSessionManager.m中有使用到
④.2 使用弊端
请问下面block
嵌套block
的代码中,会有什么问题?
- 在未加锁之前,其中的
current=9、10
有很多条,导致数据混乱,主要原因是多线程导致的
-
如果像下面这样加锁,会有什么问题?
其运行结果如下
会出现一直等待的情况,主要是因为嵌套使用的递归,使用NSLock
(简单的互斥锁,如果没有回来,会一直睡觉等待),即会存在一直加lock
,等不到unlock
的堵塞情况
所以,针对这种情况,可以使用以下方式解决
-
移动加锁位置
- 使用
@synchronized
- 使用递归锁
NSRecursiveLock
⑤ pthread_mutex
pthread_mutex
就是互斥锁
本身 —— 当锁被占用,而其他线程申请锁时,不是使用忙等,而是阻塞线程并睡眠
使用如下:
// 导入头文件
#import <pthread.h>
// 全局声明互斥锁
pthread_mutex_t _lock;
// 初始化互斥锁
pthread_mutex_init(&_lock, NULL);
// 加锁
pthread_mutex_lock(&_lock);
// 这里做需要线程安全操作
// ...
// 解锁
pthread_mutex_unlock(&_lock);
// 释放锁
pthread_mutex_destroy(&_lock);
pthread_mutex
在YYKit
中的YYMemoryCache中有所应用
⑥ NSRecursiveLock
NSRecursiveLock
在底层也是对pthread_mutex
的封装,可以通过swift
的Foundation
源码查看
对比NSLock
和 NSRecursiveLock
,其底层实现几乎一模一样,区别在于init
时,NSRecursiveLock
有一个标识PTHREAD_MUTEX_RECURSIVE
,而NSLock
是默认的
递归锁
主要是用于解决一种嵌套形式
,其中循环嵌套居多
NSRecursiveLock
在YYKit
中YYWebImageOperation.m中有用到
⑦ NSCondition
NSCondition
是一个条件锁
,在日常开发中使用较少,与信号量有点相似:线程1
需要满足条件1
才会往下走,否则会堵塞等待,直到条件满足.经典模型是生产消费者模型
NSCondition
的对象实际上作为一个锁
和 一个线程检查器
-
锁
主要为了当检测条件时保护数据源
,执行条件引发的任务 -
线程检查器
主要是根据条件决定是否继续运行线程
,即线程是否被阻塞
⑦.1 基本使用
⑦.2 源码分析
通过swift
的Foundation
源码查看NSCondition
的底层实现
其底层也是对下层pthread_mutex
的封装
-
NSCondition
是对mutex
和cond
的一种封装(cond
就是用于访问和操作特定类型数据的指针) -
wait
操作会阻塞线程
,使其进入休眠状态
,直至超时 -
signal
操作是唤醒一个正在休眠等待的线程
-
broadcast
会唤醒所有正在等待的线程
⑧ NSConditionLock
NSConditionLock
是条件锁,一旦一个线程获得锁,其他线程一定等待
.其本质就是NSCondition + Lock
.
相比NSConditionLock
而言,NSCondition
使用比较麻烦,所以推荐使用NSConditionLock
,其使用如下
//初始化
NSConditionLock *conditionLock = [[NSConditionLock alloc] initWithCondition:2];
//表示conditionLock期待获得锁,如果没有其他线程获得锁(不需要判断内部的condition) 那它能执行此行以下代码,如果已经有其他线程获得锁(可能是条件锁,或者无条件锁),则等待,直至其他线程解锁
[conditionLock lock];
//表示如果没有其他线程获得该锁,但是该锁内部的condition不等于A条件,它依然不能获得锁,仍然等待。如果内部的condition等于A条件,并且 没有其他线程获得该锁,则进入代码区,同时设置它获得该锁,其他任何线程都将等待它代码的完成,直至它解锁。
[conditionLock lockWhenCondition:A条件];
//表示释放锁,同时把内部的condition设置为A条件
[conditionLock unlockWithCondition:A条件];
// 表示如果被锁定(没获得 锁),并超过该时间则不再阻塞线程。但是注意:返回的值是NO,它没有改变锁的状态,这个函数的目的在于可以实现两种状态下的处理
return = [conditionLock lockWhenCondition:A条件 beforeDate:A时间];
以下是其swift
的底层实现
通过源码可以看出
-
NSConditionLock
是NSCondition
的封装 -
NSConditionLock
可以设置锁条件,即condition
值,而NSCondition
只是信号的通知
以下面代码为例,调试NSConditionLock
底层流程
- 在
conditionLock
部分打上相应断点,运行(需要在真机
上运行:模拟器
上运行的是Intel
指令,而真机上运行的是arm
指令),开启汇编调式
-
register read
读取寄存器,其中x0
是接收者self
,x1
是cmd
- 在
objc_msgSend
处加断点,再次读寄存器 x0 --register read x0
,此时执行到了[conditionLock lockWhenCondition:2];
- 读
x1
,即register read x1
,然后发现读不出来,因为x1
存储的是sel
,并不是对象类型,可以通过进行强转为SEL
读取
- 加符号断点
-[NSConditionLock lockWhenCondition:]
、-[NSConditionLock lockWhenCondition:beforeDate:]
,然后查看bl、b
等跳转- 读取寄存器 x0、x2是当前的
lockWhenCondition:beforeDate:
的参数,实际走的是[conditionLock lockWhenCondition:1];
- 读取寄存器 x0、x2是当前的
* 通过汇编可知,`x2`移动到了`x21`![](https://upload-images.jianshu.io/upload_images/2340353-30d591f3614f3129.jpg?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
到这里后,我们调试的目的主要有两个:NSCondition + lock
以及condition与value的值匹配
**NSCondition + lock验证 **
- 继续执行,在
bl
处断住,读取寄存器x0
,此时是跳转至NSCondition
- 读取
x1
,即po (SEL)0x00000001e6e0a271
所以可以验证NSConditionLock
在底层调用的是NSCondition
的lock
方法
condition与value的值匹配
- 继续执行,跳到
ldr
,即通过一个方法,拿到了condition 2
的属性值,存储到x8
中register read x19
-
po (SEL)0x0000000281d376d0
-- x19的地址+0x10
-
register read x8
,此时的x8
中存储的是2
-
cmp x8, x21
,意思是将x8
和x21
匹配,即2
和1
匹配,并不匹配
- 第二次来到
cmp x8, x21
,此时的x8、x21
是匹配的 ,即[conditionLock lockWhenCondition:2];
此时是x8
和 x21
是匹配的,通过断点也可以体现
验证总结一下:
-
线程 1
调用[NSConditionLock lockWhenCondition:]
,此时此刻因为不满足当前条件,所以会进入waiting
状态,当前进入到waiting
时,会释放当前的互斥锁. - 此时当前的
线程 3
调用[NSConditionLock lock:]
,本质上是调用[NSConditionLock lockBeforeDate:]
,这里不需要比对条件值
,所以线程 3
会打印 - 接下来
线程 2
执行[NSConditionLock lockWhenCondition:]
,因为满足条件值
,所以线程2
会打印,打印完成后会调用[NSConditionLock unlockWithCondition:]
,这个时候将value
设置为1
,并发送boradcast
, 此时线程 1
接收到当前的信号,唤醒执行并打印. - 自此当前打印为
线程 3->线程 2 -> 线程 1
-
[NSConditionLock lockWhenCondition:];
这里会根据传入的condition 值和 Value 值进行对比
,如果不相等
,这里就会阻塞
,进入线程池,否则的话就继续代码执行[NSConditionLock unlockWithCondition:]
,这里会先更改当前的 value 值
,然后进行广播,唤醒当前的线程
⑨ dispatch_semaphore
在iOS之武功秘籍⑬: 多线程原理与GCD和NSOperation篇章已经对信号量进行过讲解
⑩ 总结
-
OSSpinLock
自旋锁由于安全性问题,在iOS10
之后已经被废弃,其底层的实现用os_unfair_lock
替代- 使用
OSSpinLock
获取锁时,会处于忙等待状态
- 而
os_unfair_lock
是处于休眠状态
- 使用
-
atomic
原子锁自带一把自旋锁,只能保证setter、getter
时的线程安全,在日常开发中使用更多的还是nonatomic
修饰属性-
atomic
:当属性在调用setter、getter
方法时,会加上自旋锁osspinlock
,用于保证同一时刻只能有一个线程调用属性的读或写,避免了属性读写不同步的问题
.由于是底层编译器自动生成的互斥锁代码,会导致效率相对较低 -
nonatomic
:当属性在调用setter、getter
方法时,不会加上自旋锁,即线程不安全
.由于编译器不会自动生成互斥锁代码,可以提高效率
-
-
@synchronized
在底层维护了一个哈希表
进行线程data
的存储,通过链表
表示可重入
(即嵌套)的特性,虽然性能较低,但由于简单好用,使用频率很高 -
NSLock、NSRecursiveLock
底层是对pthread_mutex
的封装 -
NSCondition
和NSConditionLock
是条件锁,底层都是对pthread_mutex
的封装,当满足某一个条件时才能进行操作,和信号量dispatch_semaphore
类似
三、锁的使用场景
- 如果只是
简单
的使用,例如涉及线程安全,使用NSLock
即可 - 如果是
循环嵌套
,推荐使用@synchronized
,主要是因为使用递归锁
的性能不如使用@synchronized
的性能(因为在@synchronized
中无论怎么重入,都没有关系,而NSRecursiveLock
可能会出现崩溃现象) - 在
循环嵌套
中,如果对递归锁掌握的很好,则建议使用递归锁
,因为性能好 - 如果是
循环嵌套
,并且还有多线程影响
时,例如有等待、死锁现象时,建议使用@synchronized
写在后面
和谐学习,不急不躁.我还是我,颜色不一样的烟火.