本文主要分析一下objc_msgSend
流程,那么在分析之前我们需要先了解一下什么是Runtime
。
Runtime简单介绍
Runtime
有两个版本 ⼀个Legacy
版本(早期版本) ,⼀个Modern
版本(现⾏版本)
早期版本对应的编程接⼝:
Objective-C 1.0
;现⾏版本对应的编程接⼝:
Objective-C 2.0
;早期版本⽤于
Objective-C 1.0
,32位
的Mac OS X
的平台上;现⾏版本:
iPhone程序
和Mac OS X v10.5
及以后的系统中
的64 位
程序;
编译时
: 顾名思义就是正在编译的时候,那啥叫编译呢?就是编译器
帮你把源代码
翻译成机器
能识别的代码
。运⾏时
就是代码跑起来
了,被装载
到内存
中去了 ,(你的代码保存在磁盘上没装⼊内存之前是个死家伙。只有跑到内存中才变成活的),⽽运⾏时类型检查就与前⾯讲的编译时类型检查(或者静态类型检查)不⼀样,不是简单的扫描代码,⽽是在内存中做些操作、做些判断 。runtime
有以下三种实现方法与编译层
通过OC代码,例如 [person sayNB]
通过NSObject方法,例如isKindOfClass
通过Runtime API,例如class_getInstanceSize
使用clang
探索方法的本质
我们先使用person
对象调用sayHello
方法编译为cpp
文件,来进行实例代码分析,下面一下main函数与main.cpp文件
//main.m中方法的调用
LGPerson *person = [LGPerson alloc];
[person sayNB];
[person sayHello];
//clang编译后的cpp文件底层实现
LGPerson *person = ((LGPerson *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("LGPerson"), sel_registerName("alloc"));
((void (*)(id, SEL))(void *)objc_msgSend)((id)person, sel_registerName("sayNB"));
((void (*)(id, SEL))(void *)objc_msgSend)((id)person, sel_registerName("sayHello"));
我们可以看出方法的调用,其实就是使用objc_msgSend消息发送
,下面我们自己使用objc_msgSend发送消息
来试试能否调用到sayNB
方法,我们发现同样可以出发sayNB
方法的实现。
-
在实现下面方法之前我们需要注意的问题:
1、直接调用objc_msgSend
,需要导入头文件#import <objc/message.h>
。2、需要将
target --> Build Setting -->搜索msg -- 将enable strict checking of obc_msgSend calls
由YES
改为NO
,将严厉的检查机制关掉,否则objc_msgSend
的参数会报错。
LGPerson *person = [LGPerson alloc];
objc_msgSend(person,sel_registerName("sayNB"));
- 如果类的实例方法没找到会往上查找父类有没有实现,我们现在来验证一下这个问题
//前提条件:LGPerson只是声明了sayHello方法,父类LGTeacher有sayHello的具体实现;
LGPerson *person = [LGPerson alloc];
[person sayHello];
//objc_msgSendSuper方法中有两个参数(结构体,sel),其结构体类型是objc_super定义的结构体对象,且需要指定receiver 和 super_class两个属性
struct objc_super lgsuper;
lgsuper.receiver = person;
lgsuper.super_class = [LGTeacher class];
objc_msgSendSuper(&lgsuper, sel_registerName("sayHello"));
可以发现不管是[person sayHello]
,还是lgsuper
父类的调用,sayHello
方法有被调用,这就说明了方法的调用现在类中进行查找,如果类里面找不到就会去父类里面进行查找
。
objc_msgSend 快速查找流程分析
首先我们现在781源码
中全局搜索一下objc_msgSend
,我们选择arm64
版本,进入ENTRY _objc_msgSend
,可以看到objc_msgSend
是用汇编实现的,使用汇编速度快效率高。
-
汇编实现流程图
objc_msgSend汇编代码结合流程图的具体分析过程
_objc_msgSend实现
ENTRY _objc_msgSend
UNWIND _objc_msgSend, NoFrame
//比较_objc_msgSend的消息接收者是否为空
cmp p0, #0 // nil check and tagged pointer check 判断传入的是否为空
#if SUPPORT_TAGGED_POINTERS
//跳转
b.le LNilOrTagged // (MSB tagged pointer looks negative)
#else
b.eq LReturnZero
#endif
//获取isa表示从寄存器x0中取出isa存入p13寄存器
ldr p13, [x0] // p13 = isa
//即通过arm64架构通过isa&mask 获取到class即获取shiftcls位域的类信息
GetClassFromIsa_p16 p13 // p16 = class
//获取isa完毕done
LGetIsaDone:
// calls imp or objc_msgSend_uncached
//开始缓存查找流程,即快速查找流程
CacheLookup NORMAL, _objc_msgSend
#if SUPPORT_TAGGED_POINTERS
LNilOrTagged:
b.eq LReturnZero // nil check
// tagged
adrp x10, _objc_debug_taggedpointer_classes@PAGE
add x10, x10, _objc_debug_taggedpointer_classes@PAGEOFF
ubfx x11, x0, #60, #4
ldr x16, [x10, x11, LSL #3]
adrp x10, _OBJC_CLASS_$___NSUnrecognizedTaggedPointer@PAGE
add x10, x10, _OBJC_CLASS_$___NSUnrecognizedTaggedPointer@PAGEOFF
cmp x10, x16
b.ne LGetIsaDone
// ext tagged
adrp x10, _objc_debug_taggedpointer_ext_classes@PAGE
add x10, x10, _objc_debug_taggedpointer_ext_classes@PAGEOFF
ubfx x11, x0, #52, #8
ldr x16, [x10, x11, LSL #3]
b LGetIsaDone
// SUPPORT_TAGGED_POINTERS
#endif
LReturnZero:
// x0 is already zero
mov x1, #0
movi d0, #0
movi d1, #0
movi d2, #0
movi d3, #0
ret
END_ENTRY _objc_msgSend
【第一步】cmp p0, #0
判断消息的接受者receiver
是否为空;通过if SUPPORT_TAGGED_POINTERS
判断是否支持taggedpointer
(小对象类型)的流程,如果是返回空流程LReturnZero
,否则处理小对象的isa
流程LNilOrTagged
。
【第二步】通过ldr p13, [x0]
获取isa表示从寄存器x0
中取出isa
存入p13寄存器
,即GetClassFromIsa_p16 p13
通过arm64架构
中isa&mask
获取shiftcls位域
的类信息,即class
。
【第三步】获取isa
完毕doneLGetIsaDone
,开始缓存查找流程,即快速查找流程CacheLookup NORMAL, _objc_msgSend
。
- CacheLookup实现
.macro CacheLookup
LLookupStart$1:
//通过isa平移16个字节获取到cache
// p1 = SEL, p16 = isa
ldr p11, [x16, #CACHE] // p11 = mask|buckets
#if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
//通过掩码cache&0x0000ffffffffffff将高16位抹零,得到buckets
and p10, p11, #0x0000ffffffffffff // p10 = buckets
//p11(cache)右移48位,得到mask(即p11 存储mask),mask & p1(msgSend的第二个参数 cmd-sel) ,得到sel-imp的下标index(即搜索下标) 存入p12(cache insert写入时的哈希下标计算是 通过 sel & mask,读取时也需要通过这种方式)
and p12, p1, p11, LSR #48 // x12 = _cmd & mask
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4
and p10, p11, #~0xf // p10 = buckets
and p11, p11, #0xf // p11 = maskShift
mov p12, #0xffff
lsr p11, p12, p11 // p11 = mask = 0xffff >> p11
and p12, p1, p11 // x12 = _cmd & mask
#else
#error Unsupported cache mask storage for ARM64.
#endif
//p12, LSL#(1+PTRSHIFT)得到的就是从首地址开始的实际偏移量,存入到p12寄存器
//p12 = p10 + p12得到bucket存入p12寄存器中
//p12 = bucket
add p12, p10, p12, LSL #(1+PTRSHIFT)
// p12 = buckets + ((_cmd & mask) << (1+PTRSHIFT))
//通过bucket结构体得到imp- sel即{imp, sel} = *bucket
//p9 = sel , p17 = imp
ldp p17, p9, [x12] // {imp, sel} = *bucket
//判断查询的sel与objc_msgSend参数中传入的sel是否相等
1: cmp p9, p1 // if (bucket->sel != _cmd)
b.ne 2f // scan more
//如果相等 即cacheHit 缓存命中,直接返回imp
CacheHit $0 // call or return imp
2: // not hit: p12 = not-hit bucket
//如果一直都找不到, 因为是normal ,跳转至__objc_msgSend_uncached
CheckMiss $0 // miss if bucket->sel == 0
//判断当前的查询的bucket是否是buckets的第一个元素
cmp p12, p10 // wrap if bucket == buckets
//定位到最后一个元素(即第一个bucket)
b.eq 3f
//如果不是从最后一个元素开始往前查找{imp, sel} = *--bucket
ldp p17, p9, [x12, #-BUCKET_SIZE]! // {imp, sel} = *--bucket
b 1b // loop
3: // wrap: p12 = first bucket, w11 = mask
#if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
//p11(mask)右移44位相当于(mask *bucket的大小 )即计算从首地址平移到最后一个bucket实际内存
//平移的大小,其中mask = buckets的总个数 - 1,直接定位到buckets的最后一个元素
//注意:缓存的查找是向前查找的,因为在arm64架构中,cache的写入是从后往前写入的
add p12, p12, p11, LSR #(48 - (1+PTRSHIFT))
// p12 = buckets + (mask << 1+PTRSHIFT)
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4
add p12, p12, p11, LSL #(1+PTRSHIFT)
// p12 = buckets + (mask << 1+PTRSHIFT)
#else
#error Unsupported cache mask storage for ARM64.
#endif
// Clone scanning loop to miss instead of hang when cache is corrupt.
// The slow path may detect any corruption and halt later.
//再次递归为了防止多线程操作,刚好缓存进来
ldp p17, p9, [x12] // {imp, sel} = *bucket
1: cmp p9, p1 // if (bucket->sel != _cmd)
b.ne 2f // scan more
CacheHit $0 // call or return imp
2: // not hit: p12 = not-hit bucket
CheckMiss $0 // miss if bucket->sel == 0
//判断p12(下标对应的bucket) 是否 等于 p10(buckets数组第一个元素),表示前面已经没有了但是还是没有找到
cmp p12, p10 // wrap if bucket == buckets
b.eq 3f
ldp p17, p9, [x12, #-BUCKET_SIZE]! // {imp, sel} = *--bucket
b 1b // loop
LLookupEnd$1:
LLookupRecover$1:
3: // double wrap
//如果第二次递归还是找不到,即当前的bucket等于buckets的第一个元素,那么开启慢速查找
JumpMiss $0
.endmacro
【快速查找流程第一步】ldr p11, [x16, #CACHE]
通过isa平移16个字节
获取到cache
。
【第二步】and p10, p11,
通过掩码cache&0x0000ffffffffffff
将高16位抹零
,得到buckets
。
【第三步】and p12, p1, p11, LSR #48
,p11(cache)
右移48位
,得到mask
(即p11
存储mask
),mask & p1
(msgSend
的第二个参数cmd-sel
) ,得到sel-imp
的下标index
(即搜索下标
存入p12
(cache insert
写入时的哈希下标
计算是 通过sel & mask
,读取时
也需要通过这种方式)。
【第四步】add p12, p10, p12, LSL #(1+PTRSHIFT)
,p12, LSL#(1+PTRSHIFT)
得到的就是从首地址
开始的实际偏移量
,存入到p12寄存器
,p12 = p10 + p12
得到bucket
存入p12寄存器
中,即p12 = bucket
。
【第五步】ldp p17, p9, [x12]
,通过bucket结构体
得到imp- sel
即{imp, sel} = *bucket
。
【第六步】ldp p17, p9, [x12]
,通过bucket结构体
得到imp- sel
即{imp, sel} = *bucket,p9 = sel , p17 = imp
。
【第七步】cmp p9, p1
判断查询的sel
与objc_msgSend
参数中传入的sel
是否相等。
【第八步】如果相等缓存命中走cacheHit
流程否则走CheckMiss
流程。
【第九步】判断当前的查询的bucket
是否是buckets的第一个元素
,如果是
那么定位
到最后一个元素
,即第一个bucket
,进行第二次递归
查找进行【第五步】;如果不是
递归查找进行【第七步】。
- CheckMiss实现
.macro CheckMiss
// miss if bucket->sel == 0
.if $0 == GETIMP
//如果为GETIMP ,则跳转至 LGetImpMiss
cbz p9, LGetImpMiss
.elseif $0 == NORMAL
//如果为NORMAL ,则跳转至 __objc_msgSend_uncached
cbz p9, __objc_msgSend_uncached
.elseif $0 == LOOKUP
//如果为LOOKUP ,则跳转至 __objc_msgLookup_uncached
cbz p9, __objc_msgLookup_uncached
.else
.abort oops
.endif
.endmacro
【if】如果为GETIMP
,则跳转至 LGetImpMiss
;
【elseif】如果为NORMAL
,则跳转至__objc_msgSend_uncached
【elseif】如果为LOOKUP
,则跳转至 __objc_msgLookup_uncached
- CacheHit实现
.macro CacheHit
.if $0 == NORMAL
TailCallCachedImp x17, x12, x1, x16 // authenticate and call imp
.elseif $0 == GETIMP
mov p0, p17
cbz p0, 9f // don't ptrauth a nil imp
AuthAndResignAsIMP x0, x12, x1, x16 // authenticate imp and re-sign as IMP
9: ret // return IMP
.elseif $0 == LOOKUP
// No nil check for ptrauth: the caller would crash anyway when they
// jump to a nil IMP. We don't care if that jump also fails ptrauth.
AuthAndResignAsIMP x17, x12, x1, x16 // authenticate imp and re-sign as IMP
ret // return imp via x17
.else
.abort oops
.endif
.endmacro
缓存命中返回imp
。