借汇编之力窥探String背后的数据结构奥秘

熟悉C++、java、VB等编程语言的朋友都知道String(字符串),它是编程语言中表示文本的数据类型,字符串由若干字符组成的,是所有编程语⾔中⾮常重要的成员。可能很多朋友平时只是使用它,没有仔细研究其中的奥秘。其实,字符串还是有很多值得我们深入研究的地方。

一、思考

在 Swift 开发使用字符串的过程中,你是否有思考过以下问题?

- 1 个字符串变量占用多少内存?

- 字符串 str1、str2 的底层存储有什么不同?

- 如果对 str1、str2 进行拼接操作,str1、str2 的底层存储又会发生什么变化?

如果你能准确地回答以上问题,那说明对 Swift 字符串的底层存储机制还是比较了解的。

二、1 个字符串变量占用多少内存?

方法 1:MemoryLayout

首先,可以借助 Swift 自带的 MemoryLayout 来测试一下

方法 2:汇编

另外,我们也可以借助一个强有力的底层分析助手—汇编语言,来窥探一下 String 的底层存储

- 实际上分析其他语法、系统库的底层,都可以借助汇编语言

  - 比如多态的原理、泛型的原理、Array 的底层、枚举的底层等等

-

  另外,不仅仅是 Swift,C、C++、OC 的底层分析,依然可以借助汇编语言

  - 毕竟你写的每一行有效代码,最终都是要转成机器指令(0 和 1)

  - 而机器指令是跟汇编指令一一对应的,每一条机器指令都能翻译成与之对应的汇编指令

  - 能读懂汇编指令,就相当于能读懂机器指令,知道 CPU 具体在干嘛(操作了什么寄存器,操作了哪块内存)

- 本教程的代码是直接跑在 Mac 的命令行(CommandLineTools)项目上

  - 因此展示的汇编代码是基于 X64 的 AT&T 格式汇编,并非 iOS 真机设备的 ARM 汇编

  - 其实不同种类的汇编之间有极大的相似性,只是有些指令的叫法不一样

跟微软的 Visual Studio 一样,Xcode 也内置了非常方便的反汇编功能,可以轻松查看每一句代码对应的汇编指令,打开反汇编界面的步骤如下

- 在某一行需要调试的代码打上断点(反汇编界面会在断点调试状态下显示出来)

- 菜单:`Debug` > `Debug Workflow` > `Always Show Disassembly`

  - `Assembly` 译为汇编, `Disassembly` 译为反汇编

-   运行程序,看到反汇编界面

如果你的反汇编经验十足,根据第 16、17 行的汇编就可以推敲出来,String 是占用 16 个字节

- 因为它用了 rax、rdx 寄存器存放字符串 str 的内容,而 rax、rdx 都是 8 字节的

汇编的内容太多了,因为时间和篇幅关系,文章里并不会对每一句汇编指令进行详细地讲解,更多的是想说明汇编的重要性。

三、字符串的底层存储

窥探内存

此前我写了个可以窥探 Swift 变量内存的小工具:https://github.com/CoderMJLee/Mems

- 现在用它来窥探下字符串的 16 字节里面,究竟存储着什么数据

- `Mems.memStr(ofVal:)` 默认情况下按照 8 个字节一组来显示内存数据

- 传递参数 `alignment: .one` 是按照 1 个字节一组来显示内存数据

字符 '0'~'9' 的 ASCII 值是 0x30~0x39,认真观察最初 str1 的 16 个字节数据,你发现了什么?

- 它直接将所有字符的 ASCII 值存储在 str1 的 16 字节中

- 最后 1 个字节 0xea 中的 0xa 就是字符的数量,也是共 10 个字符

拼接

可以发现,当对 str1 进行拼接 "ABCDE" 的时候

- 它最终是将 "0123456789ABCDE"十五个字符的 ASCII 值都存储在了 str1 的 16 字节中

- 最后 1 个字节 0xef 中的 0xf 就是字符的数量,也是共 15 个字符

- 可以看得出来,目前 16 个字节已经存满了,那如果再拼接 1 个字符呢?

可以看到,str1 里面存储的数据发生了非常大的变化,每一个字符的 ASCII 值不见了,

- 那里面的 16 字节具体是什么含义呢?

- 所有字符('0'~'9'、'A' 到 'F')的 ASCII 值又存到哪去了呢?

其他情况

如果一开始初始化的时候(未拼接之前),字符串的内容就是超过 15 个字符呢?

相信你能猜到是这个结果

- 这 16 个字节里面并没有出现任何一个字符的 ASCII 值

- 而且这 16 个字节跟 `第27行的str1` 还是有所区别

  - 虽然它们的字符串内容都是"0123456789ABCDEF"

如果对 str2 进行拼接操作

不难发现:这时 str2 的 16 字节又发生了变化,跟 `第27行的str1` 是有点相似的

如何解决上述疑问?

上述的种种疑问,光看打印出来的内存数据是无法解决的,但是都可以利用【!!!汇编!!!】来解决,分析汇编指令,立马就得出结论,因为文章的篇幅有限,平时工作也比较忙,我把上述问题的详细剖析过程录制成了长达 2 个多小时的视频,有兴趣的朋友可以用 1.5~2 倍速度观看

- 链接:https://pan.baidu.com/s/1AkS3K1ZKP8zyxhlhLRaBkA

- 提取码:kzrk

- 视频对于没有汇编基础的朋友来说,可能会有点难度,最好挑一个头脑清醒的时间去观看

- 看完视频后,希望大家能够确切地感受到汇编语言的重要性,不要永远只停留在编写高级语言代码、沉迷于语法糖的层面。

四、最后

人们经常认为汇编语言的应用范围很小,而忽视它的重要性。其实汇编语言对每一个希望学习计算机科学与技术的人来说都是非常重要的,是不能不学习的语言。比如你还能玩转软件破解、游戏外挂等,这是我此前用【汇编\C++】编写的一个游戏外挂:https://github.com/CoderMJLee/SeemygoPVZCheater


我们做的这么多,当然不仅仅是为了窥探字符串的底层。同数据结构与算法一样,汇编绝对是助你程序生涯更进一步的必备良方。在编程领域,字符串只是如同茫茫宇宙中的一颗行星,渺小而又伟大。等待我们发掘探索的东西还有很多。在未来,互联网还有更多领域需要编程完成。时代进步,软件也日新月异的发展,不学习就等于倒退,就会被时代淘汰。对程序员⽽⾔,唯有不断的探索学习更多技术,才能在这⽚领域中纵横遨游。

如果你想提升自己的能力、升职加薪、突破瓶颈,那一定要学习更多有关汇编及数据结构与算法等相关信息。如果想要深入了解,欢迎添加我的微信19950277730,这里不仅有与编程界大牛面对面的机会,更有⽆数免费编程技巧和技术提升秘籍,我们期待与您共同进步。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,013评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,205评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,370评论 0 342
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,168评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,153评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,954评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,271评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,916评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,382评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,877评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,989评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,624评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,209评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,199评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,418评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,401评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,700评论 2 345

推荐阅读更多精彩内容