1.准备源码程序
源码分析alloc&init&new的流程,使用从github上下载的LGCooci的源码https://github.com/LGCooci/KCCbjc4_debug。
因为设备限制,我是基于818的源码进行学习。
从github下载完成后,在KCObjcBuild所在的目录新建一个OC类命名为Person,Person类中什么都不写。
在main.m中写入如下代码:
#import "Person.h"
Person *p1 = [Person alloc];
Person *p2 = [p1 init];
Person *p3 = [p1 init];
NSLog(@"%@ - %p - %p",p1,p1,&p1);
NSLog(@"%@ - %p - %p",p2,p2,&p2);
NSLog(@"%@ - %p - %p",p3,p3,&p3);
选择target为KCObjcBuild,就可以运行了。
指针在栈上开辟的地址,指针是int类型,64位机上大小为8字节没有问题。但是MAC上与iOS上开辟的顺序有一点区别,在iOS上P1、P2、P3的地址依次减小8;Mac上却是P1、P3、P2的顺序依次减小8。
执行的结果分析:
在OC中alloc用来分配内存空间,init进行初始化。上面代码中只分配了一个Person对象的内存空间,声明了3个指针P1、P2、P3,都指向了同一个声明的Person对象。
%@打印指针对象P1、P2、P3,打印的是他们所指向的对象,也就是那同一份Person对象,输出<Person: 0x100698e90>
%p打印指针对象P1、P2、P3,%p是打印地址,P1、P2、P3指向对象都是<Person: 0x100698e90>,打印的是Person对象的地址,所以打印的都是0x100698e90
%p打印指针&P1、&P2、&P3,P1、P2、P3是指针,&取地址符是指指针本身的地址,指针存放在栈上,所以打印的是它们在栈上的地址。
那么alloc和init具体做了什么呢?
2.用源码分析alloc创建过程
2.1修复断点不走问题
在Person *p1 = [Person alloc]
那一行,打一个断点。运行,会出现断点无效。
如果遇到断点无效的问题,确保如下两步是正确的:
- 在
Build Phases
的Compile Sources
中,将main.m
拖到最前面 - 找到
Targets
->Build Settings
->Enable Hardened Runtime
,值置为NO
2.2跟踪源码
直接step into
跟踪源码。
2.2.1先走NSObject.mm
的+ (id)alloc
方法
+ (id)alloc {
return _objc_rootAlloc(self);
}
2.2.2再走NSObject.mm
的id _objc_rootAlloc(Class cls)
方法
// Base class implementation of +alloc. cls is not nil.
// Calls [cls allocWithZone:nil].
id
_objc_rootAlloc(Class cls)
{
return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}
2.2.3再走NSObject.mm
的callAlloc
方法
static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)
{
#if __OBJC2__
if (slowpath(checkNil && !cls)) return nil;
if (fastpath(!cls->ISA()->hasCustomAWZ())) {
return _objc_rootAllocWithZone(cls, nil);
}
#endif
// No shortcuts available.
if (allocWithZone) {
return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
}
return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}
这个方法走的是上面那部分:
#if __OBJC2__
if (slowpath(checkNil && !cls)) return nil;
if (fastpath(!cls->ISA()->hasCustomAWZ())) {
return _objc_rootAllocWithZone(cls, nil);
}
#endif
objective-c2.0是2006年苹果发布版本,但是至此之后没有再重新命名objective-c3.0,虽然官方的源代码已经以OBJC4命名,但是项目中依然是OBJC2。
出于好奇,到底OBJC2是什么玩意。没有找到相关的宏定义。
看到代码中有如下一处#if !defined(__cplusplus) && !__OBJC2__
,便打印一下这其中到底是什么值:
宏
__cplusplus
定义编程语言和编译器之间的关系。
199711L(until C++11), 201103L(C++11), 201402L(C++14), 201703L(C++17), or 202002L(C++20)
宏UNAVAILABLE_ATTRIBUTE
:告知方法失效。
关于fastpath
和slowpath
,虽然不重要,但是还是了解一下:
#define fastpath(x) (__builtin_expect(bool(x), 1))
#define slowpath(x) (__builtin_expect(bool(x), 0))
C++中的
__builtin_expect()
,这个指令是gcc引入的,作用是"允许程序员将最有可能执行的分支告诉编译器"。这个指令的写法为:__builtin_expect(EXP, N)
。意思是:EXP==N的概率很大。__builtin_expect是为了生成高效的代码。fastpath定义中
__builtin_expect((x),1)
表示x 的值为真的可能性更大;即执行if里面语句的机会更大。slowpath定义中的__builtin_expect((x),0)表示x 的值为假的可能性更大。即执行else里面语句的机会更大
在日常的开发中,也可以通过设置来优化编译器,达到性能优化的目的,设置的路径为:
Build Setting--> Optimization Level--> Debug-->
将None
改为fastest
或者smallest
2.2.4再走objc-runtime-new.mm
的_objc_rootAllocWithZone
方法
id
_objc_rootAllocWithZone(Class cls, malloc_zone_t *zone __unused)
{
// allocWithZone under __OBJC2__ ignores the zone parameter
return _class_createInstanceFromZone(cls, 0, nil,
OBJECT_CONSTRUCT_CALL_BADALLOC);
}
2.2.5再走objc-runtime-new.mm
的_class_createInstanceFromZone
方法
static ALWAYS_INLINE id
_class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone,
int construct_flags = OBJECT_CONSTRUCT_NONE,
bool cxxConstruct = true,
size_t *outAllocatedSize = nil)
{
ASSERT(cls->isRealized());
// Read class's info bits all at once for performance
bool hasCxxCtor = cxxConstruct && cls->hasCxxCtor();
bool hasCxxDtor = cls->hasCxxDtor();
bool fast = cls->canAllocNonpointer();
size_t size;
size = cls->instanceSize(extraBytes);
if (outAllocatedSize) *outAllocatedSize = size;
id obj;
if (zone) {
obj = (id)malloc_zone_calloc((malloc_zone_t *)zone, 1, size);
} else {
obj = (id)calloc(1, size);
}
if (slowpath(!obj)) {
if (construct_flags & OBJECT_CONSTRUCT_CALL_BADALLOC) {
return _objc_callBadAllocHandler(cls);
}
return nil;
}
if (!zone && fast) {
obj->initInstanceIsa(cls, hasCxxDtor);//将内存空间与类关联
} else {
// Use raw pointer isa on the assumption that they might be
// doing something weird with the zone or RR.
obj->initIsa(cls);
}
if (fastpath(!hasCxxCtor)) {
return obj;
}
construct_flags |= OBJECT_CONSTRUCT_FREE_ONFAILURE;
return object_cxxConstructFromClass(obj, cls, construct_flags);
}
2.2.6 alloc重点方法分析
很明显_class_createInstanceFromZone是我们要重点研究的对象,首先思考:
- 要开辟多少内存
- 怎么取申请内存
- ISA如何跟内存进行绑定
对应在代码中
-
cls->instanceSize
:计算需要开辟的内存空间大小
-
calloc
:申请内存
,返回地址指针(Zone已经废弃) -
obj->initInstanceIsa
:将类 与 isa 关联
2.2.6.1 instanceSize分析
instanceSize方法在objc-runtime-new.h中,查看源码,断点调试
inline size_t instanceSize(size_t extraBytes) const {
if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
return cache.fastInstanceSize(extraBytes);
}
size_t size = alignedInstanceSize() + extraBytes;
// CF requires all objects be at least 16 bytes.
if (size < 16) size = 16;
return size;
}
通过断点,会执行到cache.fastInstanceSize
方法,快速计算内存大小。也就是执行cache.fastInstanceSize(extraBytes)
,继续跟进去:
size_t fastInstanceSize(size_t extra) const
{
ASSERT(hasFastInstanceSize(extra));
if (__builtin_constant_p(extra) && extra == 0) {
return _flags & FAST_CACHE_ALLOC_MASK16;
} else {
size_t size = _flags & FAST_CACHE_ALLOC_MASK;
// remove the FAST_CACHE_ALLOC_DELTA16 that was added
// by setFastInstanceSize
return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
}
}
跟进去后发现会走到第10行,align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
,继续往下跟:
static inline size_t align16(size_t x) {
return (x + size_t(15)) & ~size_t(15);
}
align16是16字节对齐算法。
内存字节对齐原则
-
数据成员对齐规则
:struct 或者 union 的数据成员,第一个数据成员放在offset为0的地方,以后每个数据成员存储的起始位置要从该成员大小或者成员的子成员大小(只要该成员有子成员,比如数据、结构体等)的整数倍开始(例如int在32位机中是4字节,则要从4的整数倍地址开始存储) -
数据成员为结构体
:如果一个结构里有某些结构体成员,则结构体成员要从其内部最大元素大小的整数倍地址开始存储(例如:struct a里面存有struct b,b里面有char、int、double等元素,则b应该从8的整数倍开始存储) -
结构体的整体对齐规则
:结构体的总大小,即sizeof
的结果,必须是其内部做大成员的整数倍,不足的要补齐
为什么需要16字节对齐
- 各种数据类型长短不一,需要统一长度,在磁盘读取时,取出固定长度数据。
2.2.6.2 calloc:申请内存,返回匿名指针
通过instanceSize
计算的内存大小,向内存中申请 大小 为 size的内存,并赋值给obj,因此 obj是指向内存地址的指针
2.2.6.3 obj->initInstanceIsa:类与isa关联
经过calloc可知,内存已经申请好了,类也已经传入进来了,接下来就需要将 类与 地址指针 即isa指针进行关联。主要过程就是初始化一个isa指针,并将isa指针指向申请的内存地址,在将指针与cls类进行关联。
2.2.6.4 总结
- 通过对
alloc
源码的分析,可以得知alloc的主要目的就是开辟内存
,而且开辟的内存需要使用16字节对齐算法
,现在开辟的内存的大小基本上都是16
的整数倍 - 开辟内存的核心步骤有3步:
计算 -- 申请 -- 关联
2.2.7 init方法
工厂方法,用于重写,自定义初始化内容。
+ (id)init {
return (id)self;
}
- (id)init {
return _objc_rootInit(self);
}
id
_objc_rootInit(id obj)
{
// In practice, it will be hard to rely on this function.
// Many classes do not properly chain -init calls.
return obj;
}
2.2.8 new方法
+ (id)new {
return [callAlloc(self, false/*checkNil*/) init];
}
通过 new 的源码可以看出,其实它也是调用了 [callAlloc init] 方法;
但是我们推荐使用 [alloc init] 方法,因为这样我们可以自定义 init 方法,使我们的开发更加的灵活。
3.在打断点后重新进行分析
真正运行的时候会发现在callAlloc方法会进入两次,先走objc_msgSend,再走_objc_rootAllocWithZone。这里涉及到另外一个知识点,这个问题可以通过LLVM源码分析得到答案,留在以后研究。