深入理解Tagged Pointer

在调试程序或者反编译App时,经常可以看到"NSTaggedPointerString"这个东西
例如:

    NSString *testStr1 = @"a";
    
    NSString *testStr2 = [NSString stringWithString:@"b"];
    
    NSString *testStr3 = [NSString stringWithFormat:@"c"];
    
    NSString *testStr4 = [[NSString alloc] initWithString:@"d"];
    
    NSString *testStr5 = [[NSString alloc] initWithFormat:@"e"];

打印:

TestImage1.png

TestImage2.png

这里首先会有两个问题:
1.为什么创建出来的地址分为两种?
2.testStr3和testStr5变量对应的类型是"NSTaggedPointerString",这个到底是什么?

对于问题1,首先我们来聊聊关于NSString的内存管理特性.
我们一般会通过以上几种方法来创建NSString
通过打印的地址我们发现,test1,test2,test4都是在一个内存区域,其实就是常量内存区。test3,test5在一个内存区,也就是堆区
这里就有一个疑问:[NSString alloc] initWithString:@"d"这种方式初始化的字符串,也就是test4.应该是位于堆区的,但为什么会跑到常量内存区来呢?据说是因为xcode对这种方式做了处理,还包括[NSString stringWithString:@"b"]这种方式,这两种初始化字符串都等同于@"a"了。所以说test2,test4都同等于test1了。
我们打印一下引用计数,

2017-5-5 17:35:25.585 StringDemo[8514:11303] test1:4294967295

2017-5-5 17:35:25.586 StringDemo[8514:11303] test2:4294967295

2017-5-5 17:35:25.596 StringDemo[8514:11303] test3:1

2017-5-5 17:35:25.600 StringDemo[8514:11303] test4:4294967295

2017-5-5 17:35:25.600 StringDemo[8514:11303] test5:1

通过引用计数,也进一步印证了我们刚刚的结论,test3和test5位于堆区,需要自己手动释放
所以对问题一的总结如下:
对NSString的初始化方法,对于test1,test2,test4这三种的话建议用=@“字符串”来使用,因为本来就是一样的。test3,test5这两种的话,建议用texst3这种,方便点,不用管内存问题,系统自已管理。

对于问题2,我们首先来观察下test3和test5的地址
testStr3 = "c" 地址: 0xa000000000000631
testStr5 = "e" 地址: 0xa000000000000651

细心的你是否发现了什么规律吗?

字母c对应地址中63,字母e对应地址中的65,我们很容易联想到ASCII码表,所以我们大胆的猜测testStr3和testStr5的指针地址里存放指针对象的值!

这正是我们今天要讨论的主题,Tagged Pointer
首先来看一下介绍:
其实早在在2013年9月,苹果推出了iPhone5s,与此同时,iPhone5s配备了首个采用64位架构的A7双核处理器,为了节省内存和提高执行效率,苹果提出了Tagged Pointer
的概念。对于64位程序,引入Tagged Pointer后,相关逻辑能减少一半的内存占用,以及3倍的访问速度提升,100倍的创建、销毁速度提升。本文从Tagged Pointer
试图解决的问题入手,带领读者理解Tagged Pointer
的实现细节和优势,最后指出了使用时的注意事项。

问题

我们先看看原有的对象为什么会浪费内存。假设我们要存储一个NSNumber对象,其值是一个整数。正常情况下,如果这个整数只是一个NSInteger的普通变量,那么它所占用的内存是与CPU的位数有关,在32位CPU下占4个字节,在64位CPU下是占8个字节的。而指针类型的大小通常也是与CPU位数相关,一个指针所占用的内存在32位CPU下为4个字节,在64位CPU下也是8个字节。

所以一个普通的iOS程序,如果没有Tagged Pointer对象,从32位机器迁移到64位机器中后,虽然逻辑没有任何变化,但这种NSNumber、NSDate一类的对象所占用的内存会翻倍。如下图所示:

TestImage3.png

我们再来看看效率上的问题,为了存储和访问一个NSNumber对象,我们需要在堆上为其分配内存,另外还要维护它的引用计数,管理它的生命期。这些都给程序增加了额外的逻辑,造成运行效率上的损失。

Tagged Pointer

为了改进上面提到的内存占用和效率问题,苹果提出了Tagged Pointer对象。由于NSNumber、NSDate一类的变量本身的值需要占用的内存大小常常不需要8个字节,拿整数来说,4个字节所能表示的有符号整数就可以达到20多亿(注:2^31=2147483648,另外1位作为符号位),对于绝大多数情况都是可以处理的。

所以我们可以将一个对象的指针拆成两部分,一部分直接保存数据,另一部分作为特殊标记,表示这是一个特别的指针,不指向任何一个地址。所以,引入了Tagged Pointer对象之后,64位CPU下NSNumber的内存图变成了以下这样:

4.png

对此,我们也可以用 Xcode做实验来验证。我们的实验代码如下:

NSNumber *number1 = @1;
NSNumber *number2 = @2;
NSNumber *number3 = @3;
NSNumber *numberFFFF = @(0xFFFF);
NSLog(@"number1 pointer is %p", number1);
NSLog(@"number2 pointer is %p", number2);
NSLog(@"number3 pointer is %p", number3);
NSLog(@"numberffff pointer is %p", numberFFFF);

运行之后,我们得到的结果如下,可以看到,除去最后的数字最末尾的2以及最开头的0xb,其它数字刚好表示了相应NSNumber的值。

number1 pointer is 0xb000000000000012
number2 pointer is 0xb000000000000022
number3 pointer is 0xb000000000000032
numberFFFF pointer is 0xb0000000000ffff2

可见,苹果确实是将值直接存储到了指针本身里面。我们还可以猜测,数字最末尾的2以及最开头的0xb是否就是苹果对于Tagged Pointer的特殊标记呢?我们尝试放一个8字节的长的整数到NSNumber实例中,对于这样的实例,由于Tagged Pointer无法将其按上面的压缩方式来保存,那么应该就会以普通对象的方式来保存,我们的实验代码如下

NSNumber *bigNumber = @(0xEFFFFFFFFFFFFFFF);
NSLog(@"bigNumber pointer is %p", bigNumber);

运行之后,结果如下,验证了我们的猜测,bigNumber的地址更像是一个普通的指针地址,和它本身的值看不出任何关系:

bigNumber pointer is 0x10921ecc0

可见,当8字节可以承载用于表示的数值时,系统就会以Tagged Pointer
的方式生成指针,如果8字节承载不了时,则又用以前的方式来生成普通的指针。关于以上关于Tag Pointer
的存储细节,我们也可以在这里找到相应的讨论,但是其中关于Tagged Pointer
的实现细节与我们的实验并不相符,笔者认为可能是苹果更改了具体的实现细节,并且这并不影响Tagged Pointer
我们讨论Tagged Pointer本身的优点。

特点

1.我们也可以在WWDC2013的《Session 404 Advanced in Objective-C》视频中,看到苹果对于Tagged Pointer特点的介绍:
Tagged Pointer专门用来存储小的对象,例如NSNumber和NSDate

2.Tagged Pointer指针的值不再是地址了,而是真正的值。所以,实际上它不再是一个对象了,它只是一个披着对象皮的普通变量而已。所以,它的内存并不存储在堆中,也不需要malloc和free。

3.在内存读取上有着3倍的效率,创建时比以前快106倍。

由此可见,苹果引入Tagged Pointer
,不但减少了64位机器下程序的内存占用,还提高了运行效率。完美地解决了小内存对象在存储和访问效率上的问题。

isa指针

Tagged Pointer的引入也带来了问题,即Tagged Pointer因为并不是真正的对象,而是一个伪对象,所以你如果完全把它当成对象来使,可能会让它露马脚。所有对象都有 isa指针,而Tagged Pointer
其实是没有的,因为它不是真正的对象。 因为不是真正的对象,所以如果你直接访问Tagged Pointer
的isa成员的话,在编译时将会有如下警告:

5.png

对于上面的写法,应该换成相应的方法调用,如 isKindOfClass 和 object_getClass。只要避免在代码中直接访问对象的isa变量,即可避免这个问题。

总结

苹果将Tagged Pointer引入,给64位系统带来了内存的节省和运行效率的提高。Tagged Pointer通过在其最后一个bit位设置一个特殊标记,用于将数据直接保存在指针本身中。因为Tagged Pointer并不是真正的对象,我们在使用时需要注意不要直接访问其isa变量。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,271评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,275评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,151评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,550评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,553评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,559评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,924评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,580评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,826评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,578评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,661评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,363评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,940评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,926评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,872评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,391评论 2 342

推荐阅读更多精彩内容