写在前面
相信大家对block
都有一定的了解,日常开发中也经常能看到它的身影.本文会从block
概念、blcok
循环引用、block
底层三方面进行讲解
一、Block初探
① block定义
带有自动变量(局部变量)的匿名函数叫做block
,又叫做匿名函数
、代码块
② block分类
block
主要有三种类型
-
__NSGlobalBlock__
:全局block
,存储在全局区
此时的block
无参也无返回值,属于全局block
-
__NSMallocBlock__
:堆区block
,因为block既是函数,也是对象
此时的block
会访问外界变量,即底层拷贝a
,所以是堆区block
-
__NSStackBlock__
:栈区block
其中局部变量a
在没有处理之前(即没有拷贝之前)是 栈区block
, 处理后(即拷贝之后)是堆区block
,目前的栈区block
越来越少了
这个情况下,可以通过__weak
不进行强持有,block
就还是栈区block
总结:
-
block
直接存储在全局区 - 如果
block
访问外界变量,并进行block
相应拷贝,即copy
操作- 如果此时的
block是强引用
,则block
存储在堆区
,即堆区block
- 如果此时的
block
通过__weak
变成了弱引用,则block
存储在栈区
,即栈区block
- 如果此时的
二、Block循环引用
① 循环引用的分析
-
正常释放
:是指A持有B
的引用,当A
调用dealloc
方法,给B
发送release
信号,B
收到release
信号,如果此时B
的retainCount
(即引用计数)为0
时,则调用B
的dealloc
方法
-
循环引用
:A、B
相互持有,所以导致A
无法调用dealloc
方法给B
发送release
信号,而B
也无法接收到release
信号.所以A、B
此时都无法释放
② 解决循环引用
请问下面两段代码有循环引用吗?
- 代码一种发
生了循环引用
,因为在block
内部使用了外部变量name
,导致block持有了self
,而self原本是持有block
的,所以导致了self和block的相互持有
. - 代码二中
无循环引用
,虽然也使用了外部变量,但是self
并没有持有animation
的block
,仅仅只有animation
持有self
,不构成相互持有.
解决循环引用常见的方式有以下几种:
- 方式①:
weak-strong-dance
-- 强弱共舞 - 方式②:
__block
修饰对象(需要注意的是在block
内部需要置空
对象,而且block
必须调用) - 方式③: 传递对象
self
作为block
的参数,提供给block
内部使用 - 方式④: 使用
NSProxy
②.1 方式①: weak-strong-dance
- 如果
block
内部并未嵌套block
,直接使用__weak
修饰self
即可
此时的weakSelf
和self
指向同一片内存空间
,且使用__weak
不会导致self
的引用计数发生变化,可以通过打印weakSelf
和self
的指针地址,以及self
的引用计数来验证,如下所示
- 如果
block
内部嵌套block
,需要同时使用__weak
和__strong
其中strongSelf
是一个临时变量,在block
的作用域内,即内部block
执行完就释放strongSelf
这种方式属于打破self对block的强引用
,依赖于中介者模式
,属于自动置为nil
,即自动释放
②.2 方式②: __block修饰变量
这种方式同样依赖于中介者模式
,属于手动释放
,是通过__block
修饰对象,主要是因为__block
修饰的对象是可以改变的
需要注意的是这里的block
必须调用,如果不调用block
,vc
就不会置空,那么依旧是循环引用,self
和block
都不会被释放.
②.3 方式③: 对象self作为参数
主要是将对象self
作为参数,提供给block
内部使用,不会有引用计数问题
②.4 方式④: NSProxy 虚拟类
OC
是只能单继承
的语言,但是它是基于运行时的机制
,所以可以通过NSProxy
来实现伪多继承
,填补了多继承的空白NSProxy
和NSObject
是同级的一个类,也可以说是一个虚拟类
,只是实现了NSObject
的协议-
NSProxy
其实是一个消息重定向封装的一个抽象类
,类似一个代理人,中间件,可以通过继承它,并重写下面两个方法来实现消息转发到另一个实例- (void)forwardInvocation:(NSInvocation *)invocation; - (nullable NSMethodSignature *)methodSignatureForSelector:(SEL)sel
使用场景
NSProxy
的使用场景主要有两种
- 实现
多继承
功能 - 解决了
NSTimer&CADisplayLink
创建时对self
强引用问题,参考YYKit
的YYWeakProxy
循环引用解决原理
主要是通过自定义的NSProxy
类的对象来代替self
,并使用方法实现消息转发
下面是NSProxy
子类的实现以及使用的场景
- 自定义一个
NSProxy
的子类CJLProxy
- 自定义
TCJCat
类和TCJDog
类
- 通过
TCJProxy
实现多继承功能
- 通过
TCJProxy
解决定时器中self
的强引用问题
②.5 总结
循环应用的解决方式从根本上来说就两种,以self -> block -> self
为例
- 打破
self
对block
的强引用,可以block
属性修饰符使用weak
,但是这样会导致block
还每创建完就释放了,所以从这里打破强引用行不通 - 打破
block
对self
的强引用,主要就是self
的作用域和block
作用域的通讯,通讯有代理、传值、通知、传参
等几种方式,用于解决循环,常见的解决方式如下:weak-strong-dance
-
__block
(block
内对象置空,且调用block
) - 将对象
self
作为block
的参数 - 通过
NSProxy
的子类代替self
三、Block底层原理
主要是通过clang
、断点调试
等方式分析Block
底层
③.1 block本质
- 定义
block.c
文件
- 通过
xcrun -sdk iphonesimulator clang -arch x86_64 -rewrite-objc block.c
,将block.c
编译成block.cpp
,其中block
在底层被编译成了以下的形式
通过简化我们知道:相当于block
等于__main_block_impl_0
,是一个函数
- 查看
__main_block_impl_0
,是一个结构体
,同时可以说明block
是一个__main_block_impl_0
类型的对象,这也是为什么block
能够%@
打印的原因.
总结:block
的本质
是对象、函数、结构体
,由于block
函数没有名称,也被称为匿名函数
或代码块
block
通过clang
编译后的源码间的关系如下所示,以__block
修饰的变量为例
③.1.1 block为什么需要调用
在底层block
的类型为__main_block_impl_0
结构体,通过其同名构造函数创建,第一个传入的block
的内部实现代码块,即__main_block_func_0
,用fp
表示,然后赋值给impl
的FuncPtr
属性,然后在main
中进行了调用,这也是block
为什么需要调用的原因.如果不调用,block
内部实现的代码块将无法执行,可以总结为以下两点
-
函数声明
:即block
内部实现声明成了一个函数__main_block_func_0
-
执行具体的函数实现
:通过调用block
的FuncPtr
指针,调用block
执行
③.1.2 block是如何获取外界变量的
-
定义一个变量,并在
block
中调用 -
底层编译成下面这样
__main_block_func_0
中的a
是值拷贝
,如果此时在block
内部实现中作 a++
操作,是有问题的,会造成编译器的代码歧义,即此时的a是只读的
.
总结:block捕获外界变量时,在内部会自动生成同一个属性来保存
③.1.3 __block的原理
- 对
a
加一个__block
,然后在block
中对a
进行++
操作
-
main
中的a
是通过外界变量封装的对象
-
__main_block_impl_0
中,将对象a
的地址&a
给构造函数 - 在
__main_block_func_0
内部对a
的处理是指针拷贝
,此时创建的对象a
与传入对象的a
指向同一片内存空间
总结:
-
外界变量
通过__block
生成__Block_byref_a_0
结构体 -
结构体
用来保存原始变量的指针和值
- 将变量生成的
结构体对象的指针地址
传递给block
,然后在block
内部就可以对外界变量进行操作了
上面__block
和非__block
修饰局部变量产生两种不同的拷贝
-
非__block修饰
:值拷贝
-深拷贝
,只是拷贝数值,且拷贝的值不可更改,指向不同的内存空间,案例中普通变量a
就是值拷贝
-
__block修饰
:指针拷贝
-浅拷贝
,生成的对象
指向同一片内存空间
,案例中经过__block
修饰的变量a
就是指针拷贝
③.2 分析block源码所在位置
- 通过在
block
处打断点,分析运行时的block
,打开汇编
- 加
objc_retainBlock
符号断点,发现会走到_Block_copy
- 加
_Block_copy
符号断点,运行断住,在libsystem_blocks.dylib
源码中
可以到苹果开源网站下载最新的libclosure-78源码,通过查看_Block_copy
的源码实现,发现block
在底层的真正类型是Block_layout
③.3 Block真正类型 -- Block_layout
查看Block_layout
类型的定义,是一个结构体
-
isa
:指向表明block
类型的类 -
flags
:标识符,按bit
位表示一些block
的附加信息,类似于isa
中的位域,其中flags
的种类有以下几种,主要重点关注BLOCK_HAS_COPY_DISPOSE
和BLOCK_HAS_SIGNATURE
.BLOCK_HAS_COPY_DISPOSE
决定是否有Block_descriptor_2
.BLOCK_HAS_SIGNATURE
决定是否有Block_descriptor_3
- 第1位:
BLOCK_DEALLOCATING
,释放标记,-般常用BLOCK_NEEDS_FREE
做位与
操作,一同传入Flags
, 告知该block
可释放 - 第16位:
BLOCK_REFCOUNT_MASK
,存储引用计数的值
;是一个可选用参数 - 第24位:
BLOCK_NEEDS_FREE
,第16是否有效的标志
,程序根据它来决定是否增加或是减少引用计数位的
值; - 第25位:
BLOCK_HAS_COPY_DISPOSE
,是否拥有拷贝辅助函数
(a copy helper function); - 第26位:
BLOCK_HAS_CTOR
,是否拥有block
析构函数; - 第27位:
BLOCK_IS_GC
,标志是否有垃圾回收;//OS X - 第28位:
BLOCK_IS_GLOBAL
,标志是否是全局block
; - 第30位:
BLOCK_HAS_SIGNATURE
,与BLOCK_USE_STRET
相对,判断当前block
是否拥有一个签名.用于runtime
时动态调用
- 第1位:
-
reserved
:保留信息,可以理解预留位置,猜测是用于存储block
内部变量信息 -
invoke
:是一个函数指针
,指向block
的执行代码 -
descriptor
:block
的附加信息,比如保留变量数
、block的大小
、进行copy
或dispose的辅助函数指针
.有三类-
Block_descriptor_1
是必选的 -
Block_descriptor_2
和Block_descriptor_3
都是可选的
-
以上关于descriptor
的分类可以从其构造函数中体现,其中Block_descriptor_2
和Block_descriptor_3
都是通过Block_descriptor_1
的地址,经过内存平移
得到的
③.4 Block内存变化
- 打断点运行,打开汇编调式,走到
objc_retainBlock
,block
断点处读取寄存器x0
,此时的block
是全局block
,即__NSGlobalBlock__
类型
- 增加外部
变量a
,并在block
内打印
此时读取block
断点处读取寄存器x0
,此时的block
是 栈block
-- __NSStackBlock__
- 执行到符号断点
objc_retainBlock
时,还是栈区block
- 增加
_Block_copy
符号断点并断住,直接在最后的ret
加断点,读取x0
,发现经过_Block_copy
之后,变成了堆block
,即__NSMallocBlock__
,主要是因为block
地址发生了改变,为堆block
调用情况
- 同样也可以通过断点来验证
-
register read x0
读取x0
,为堆block
- 继续往下走,
register read x9
读取x9
,还是堆block
- 继续往下
register read x11
,此时是指向一片内存空间,用于存储_block_invoke
- 按住
control + step into
,进入_block_invoke
,可以得出是通过内存平移
得到的block
内部实现
前面提到的Block_layout
的结构体源码,从源码中可以看出,有个属性invoke
,即block
的执行者,是从isa
的首地址平移 16字节
取到invoke
,然后进行调用执行的.
③.5 签名
继续操作,读取x0
寄存器,看内存布局,通过 内存平移
3*8
就可获得Block_layout
的属性descriptor
,主要是为了查看是否有Block_descriptor_2
和Block_descriptor_3
,其中3
中有block
的签名
-
register read x0
,读取寄存器x0
-
po 0x0000000280ad9fb0
,打印block
-
x/8gx 0x0000000280ad9fb0
,即打印block
内存情况
-
x/8gx 0x0000000100024010
, 查看descriptor
的内存情况,其中第三个0x0000000100023396
表示签名
- 判断是否有
Block_descriptor_2
,即flags
的BLOCK_HAS_COPY_DISPOSE
(拷贝辅助函数)是否有值-
p/x 1<<25
,即1左移25位
,其十六进制为0x2000000
-
p 0x02000000 & 0x00000000c1000002
,即BLOCK_HAS_COPY_DISPOSE & flags
,等于0
,表示没有Block_descriptor_2
-
- 判断是否有
Block_descriptor_3
-
p/x 1<<30
,即1左移30位
-
p 0x40000000 & 0x00000000c1000002
,即BLOCK_HAS_SIGNATURE & flags
,有值,说明有Block_descriptor_3
-
p (char *)0x000000010089f395
-- 获取Block_descriptor_3
中的属性signature
签名
-
po [NSMethodSignature signatureWithObjCTypes:"v8@?0"]
,即打印签名
其中签名的部分说明如下
//无返回值
return value: -------- -------- -------- --------
type encoding (v) 'v'
flags {}
modifiers {}
frame {offset = 0, offset adjust = 0, size = 0, size adjust = 0}
memory {offset = 0, size = 0}
argument 0: -------- -------- -------- --------
//encoding = (@),类型是 @?
type encoding (@) '@?'
//@是isObject ,?是isBlock,代表 isBlockObject
flags {isObject, isBlock}
modifiers {}
frame {offset = 0, offset adjust = 0, size = 8, size adjust = 0}
//所在偏移位置是8字节
memory {offset = 0, size = 8}
block
的签名信息类似于方法的签名信息,主要是体现block
的返回值,参数以及类型等信息.
③.6 block三次copy分析
③.6.1 _Block_copy源码分析
进入_Block_copy
源码,将block
从栈区
拷贝至堆区
- 如果需要释放,则直接释放
-
block
的引用计数不受runtime
处理的,是由自己管理的 这里可能有个疑问 —— 为什么引用计数是 +2 而不是 +1 ?
因为
flags
的第一号位置已经存储着释放标记
-
- 如果是
globalBlock
,则不需要copy
,直接返回 - 反之,只有两种情况:
栈区block
or堆区block
,由于堆区block
需要申请空间,前面并没有申请空间的相关代码,所以只能是栈区block
- 通过
malloc
申请内存空间用于接收block
- 通过
memmove
将block
拷贝至新申请的内存中 - 设置
block
对象的类型为堆区block
,即result->isa = _NSConcreteMallocBlock
- 通过
③.6.2 _Block_object_assign 分析
想要分析block
的三层copy
,首先需要知道外部变量的种类有哪些,在__block的cpp文件中
,在函数声明时会传__main_block_desc_0_DATA
结构体,在里面又会去调用__main_block_copy_0
函数,__main_block_copy_0
里面会调用_Block_object_assign
.
对block修饰
其中用的最多的是BLOCK_FIELD_IS_OBJECT
和BLOCK_FIELD_IS_BYREF
而_Block_object_assign
是在底层编译代码中,外部变量拷贝时调用的方法就是它
进入_Block_object_assign
源码
- 1.如果是普通对象,则交给
ARC
处理,并拷贝对象指针
,即引用计数+1
,所以外界变量不能释放
- 2.如果是
block
类型的,则通过_Block_copy
操作,将block
从栈区拷贝到堆区
- 3.如果是
__block
修饰的变量,调用_Block_byref_copy
函数,进行内存拷贝
以及常规处理
此时捕获到的变量是被__block
修饰的BLOCK_FIELD_IS_BYREF
类型,就会调用*dest = _Block_byref_copy(object);
- 1.将传入的对象,强转为
Block_byref
结构体类型对象,保存一份 - 2.没有将外界变量
拷贝到堆
,需要申请内存
,其进行拷贝
- 如果已经拷贝过了,则进行处理并返回
- 其中
copy
和src
的forwarding
指针都指向同一片内存
,这也是为什么__block
修饰的对象具有修改能力
的原因 -
(*src2->byref_keep)(copy, src)
-
(*src2->byref_keep)(copy, src)
跟进去会来到Block_byref
结构来,而byref_keep
是Block_byref
的第5个
属性
-
代码调试
- 定义一个
__block
修饰的NSString
对象
- 进行
clang
编译结果如下 - 编译后的
cj_name
比普通变量多了__Block_byref_id_object_copy_131
和__Block_byref_id_object_dispose_131
-
__Block_byref_cj_name_0
结构体中多了__Block_byref_id_object_copy
和__Block_byref_id_object_dispose
通过上面的分析,我们可以知道这些方法的执行顺序_Block_copy
->_Block_byref_copy
->_Block_object_assign
,正好对应上述的三层copy
综上所述,那么block
是如何拿到cj_name
的呢?
- 1、通过
_Block_copy
方法,将block
拷贝一份至堆区 - 2、通过
_Block_object_assign
方法正常拷贝,因为__block
修饰的外界变量在底层是Block_byref
结构体 - 3、发现外部变量还存有一个对象,从
bref
中取出相应对象cj_name
,拷贝至block
空间,才能使用(相同空间才能使用,不同则不能使用).最后通过内存平移就得到了cj_name
,此时的cj_name
和 外界的cj_name
是同一片内存空间(从_Block_object_assign
方法中的*dest = object;
看出)
三层copy总结
综上所述,block
的三层拷贝是指以下三层:
- 【第一层】通过
_Block_copy
实现对象的自身拷贝,从栈区拷贝至堆区 - 【第二层】通过
_Block_byref_copy
方法,将对象拷贝为Block_byref
结构体类型 - 【第三层】调用
_Block_object_assign
方法,对__block
修饰的当前变量的拷贝
注意:只有__block
修饰的对象,block
的copy
才有三层
③.6.3 _Block_object_dispose 分析
在__Block_byref_id_object_dispose_131
实现中调用的就是_Block_object_dispose
,下面我们看下_Block_object_dispose
的底层实现:
通过源码我们可以知道_Block_object_dispose
是进行release
操作,通过不同分区的block
,进行不同的释放操作
.而_Block_object_assign
是进行retain
操作的.
- 进入
_Block_byref_release
源码,主要就是对象、变量的释放销毁
- 如果是释放对象就什么也不做(自动释放)
- 如果是
__block
修饰,就将指向指回原来的区域并使用free释放
③.6.4 总结
-
block
的本质是个__main_block_impl_0
的结构体对象,所以能用%@
打印 -
block
声明只是将block
实现保存起来,具体的函数实现需要自行调用
-
block
捕获外界变量时block
结构体会自动生成一个属性
来保存变量 -
__block
修饰的属性在底层会生成响应的结构体,保存原始变量的指针,并传递一个指针地址给block
-
block
中有三层拷贝:拷贝block
、拷贝捕获变量的内存地址
、拷贝对象
Block
的三层copy
的流程如下图所示
写在后面
和谐学习,不急不躁.我还是我,颜色不一样的烟火.