iOS-逆向02-函数本质

《iOS底层原理文章汇总》

关于CPU的补充

寄存器

CPU除了有控制器、运算器还有寄存器。其中寄存器的作用就是进行数据的临时存储。

CPU的运算速度是非常快的，为了性能CPU在内部开辟一小块临时存储区域，并在进行运算时先将数据从内存复制到这一小块临时存储区域中，运算时就在这一小快临时存储区域内进行。我们称这一小块临时存储区域为寄存器。

对于arm64系的CPU来说，如果寄存器以x开头则表明的是一个64位的寄存器，如果以w开头则表明是一个32位的寄存器，在系统中没有提供16位和8位的寄存器供访问和使用。其中32位的寄存器是64位寄存器的低32位部分并不是独立存在的。

高速缓存

iPhoneX上搭载的ARM处理器A11它的1级缓存的容量是64KB，2级缓存的容量8M.

CPU每执行一条指令前都需要从内存中将指令读取到CPU内并执行。而寄存器的运行速度相比内存读写要快很多,为了性能,CPU还集成了一个高速缓存存储区域.当程序在运行时，先将要执行的指令代码以及数据复制到高速缓存中去(由操作系统完成).CPU直接从高速缓存依次读取指令来执行.

寄存器的补充

数据地址寄存器

数据地址寄存器通常用来做数据计算的临时存储、做累加、计数、地址保存等功能。定义这些寄存器的作用主要是用于在CPU指令中保存操作数，在CPU中当做一些常规变量来使用。
ARM64中

64位: X0-X30, XZR(零寄存器)
32位: W0-W30, WZR(零寄存器)

注意:
之前讲解8086汇编中有一种特殊的寄存器段寄存器:CS,DS,SS,ES四个寄存器来保存这些段的基地址,这个属于Intel架构CPU中.在ARM中并没有

浮点和向量寄存器

因为浮点数的存储以及其运算的特殊性,CPU中专门提供浮点数寄存器来处理浮点数

浮点寄存器 64位: D0 - D31 32位: S0 - S31

现在的CPU支持向量运算.(向量运算在图形处理相关的领域用得非常的多)为了支持向量计算系统了也提供了众多的向量寄存器.

向量寄存器 128位:V0-V31

栈

栈：是一种具有特殊的访问方式的存储空间（后进先出， Last In Out First，LIFO）

15193998892055

SP和FP寄存器

sp寄存器在任意时刻会保存我们栈顶的地址.
fp寄存器也称为x29寄存器属于通用寄存器,但是在某些时刻我们利用它保存栈底的地址!

注意:ARM64开始,取消32位的 LDM,STM,PUSH,POP指令! 取而代之的是ldr\ldp str\stp
ARM64里面对栈的操作是16字节对齐的!!

函数调用栈

常见的函数调用开辟和恢复的栈空间

sub    sp, sp, #0x40             ; 拉伸0x40（64字节）空间
stp    x29, x30, [sp, #0x30]     ;x29\x30 寄存器入栈保护
add    x29, sp, #0x30            ; x29指向栈帧的底部
... 
ldp    x29, x30, [sp, #0x30]     ;恢复x29/x30 寄存器的值
add    sp, sp, #0x40             ; 栈平衡
ret

image

关于内存读写指令

注意:读/写数据是都是往高地址读/写

str(store register)指令

将数据从寄存器中读出来,存到内存中.

ldr(load register)指令

将数据从内存中读出来,存到寄存器中

此ldr 和 str 的变种ldp 和 stp 还可以操作2个寄存器.

[]中括号中的内容代表寻址

image

1.开辟32字节内存空间
2.从寄存器中读取x0和x1的值存放到sp+0x10的栈地址空间中，两个8字节正好是16字节
3.从sp+0x10的栈地址内存中读取值存放到x1和x0中，正好进行了x0和x1的值的交换
4.返回ViewDidLoad函数中

变化的是寄存器x0和x1里面的内容，没有变化的是sp寄存器里面的内容，和内存中的内容，sp相当于一个标记指针

此时此刻栈空间并没有平衡，有32个字节没有回收，你的世界少了32个字节

image

sp往上平移32个字节，释放申请的32个字节的内存空间，保持栈平衡

image

关于虚拟内存的一张图

栈(stack),堆区(head),全局区/静态区(未初始化),全局区/静态区(已经初始化过的),常量，代码区

image

Mach-O文件:全局区/静态区(未初始化),全局区/静态区(已经初始化过的),常量，代码区

栈区和堆区是在代码不断执行过程中去开辟的，栈是从高地址往低地址减，栈顶有专门的sp去记录，堆是低地址往高地址加

死循环会不会崩溃:

1.没有开辟内存空间，一直执行，程序不会崩溃

image

2.有开辟内存空间,会一直申请开辟内存空间，sp一直减，此时程序会堆栈溢出stack overflow，即堆和栈碰头了，地址空间用完了

image

堆栈操作练习

使用32个字节空间作为这段程序的栈空间,然后利用栈将x0和x1的值进行交换.

sub    sp, sp, #0x20    ;拉伸栈空间32个字节
stp    x0, x1, [sp, #0x10] ;sp往上加16个字节,存放x0 和 x1
ldp    x1, x0, [sp, #0x10] ;将sp偏移16个字节的值取出来,放入x1 和 x0

bl和ret指令

bl标号

将下一条指令的地址放入lr(x30)寄存器
转到标号处执行指令

ret

默认使用lr(x30)寄存器的值,通过底层指令提示CPU此处作为下条指令地址!

ARM64平台的特色指令,它面向硬件做了优化处理的

x30寄存器

x30寄存器存放的是函数的返回地址.当ret指令执行时刻,会寻找x30寄存器保存的地址值!

注意:在函数嵌套调用的时候.需要将x30入栈!

图片.png

调试汇编代码:从ViewDidLoad方法中跳入B之后,lr寄存器中存放回到ViewDidLoad方法的吓一跳指令的值

image

从方法A跳入B,lr的值发生改变，lr存放A中bl跳转前的吓一跳指令的地址，便于B中ret后能回到A中，ret只会看lr

image

PC寄存器:是指接下来要执行的内存地址
ret:让CPU将lr作为接下来要执行的内存地址，会把lr里面的值赋值给pc,ret改变pc，bl改变pc和lr

从A中跳转到B中后，ret让CPU从B中回到A中的mov x0,#0xaaaa指令

image

回到A中后，lr的值仍旧为A中跳入B中之前的指令mov x0,#xaaaa的内存地址，此时执行ret时会进入循环进入mov x0,#0xaaaa,此时死循环了，

image

此时要想回到ViewDidLoad方法呢？该如何操作
保护lr寄存器回家的路:保存lr的值到其他的寄存器中不安全，因为其他的寄存器在接下来函数的调用中有可能被占用导致修改

通过bt可以发现,堆栈中存在很多函数嵌套调用,若用寄存器存lr的值，极有可能被覆盖，此时我们想到用自己的栈来保存lr的值

image

首先查看系统在处理嵌套调用时，是怎么保存回家的路lr的值的

image

1.stp x29, x30, [sp, #-0x10]!:将x29(fp),x30(lr)两个寄存器的值读取出来存到新开辟的16字节内存空间sp-0x10中，寄存器是64位8字节，正好两个寄存器保存的内存地址内容大小为8字节，！表示将[sp,#-0x10]算出来的值赋值给sp

2.ldp x29, x30, [sp], #0x10:从sp寄存器开始的位置读取两个8字节的内容分别赋值给x29和x30寄存器，并将sp寄存器的地址指向sp+#0x16，即回收地址，保持栈平衡

3.mov x29, sp:x29保存sp的值，x29和sp指向栈顶，也是栈底，即栈顶和栈底是同一片区域

image

进入d函数之前lr的值为回到c函数的bl指令的下一条指令的地址

image

回到c函数之后执行ldp x29, x30, [sp], #0x10,则lr的地址为从ViewDidLoad中进入c函数之前保存的lr的值，回到ViewDidLoad中方法的回家的路，进入c函数之后ret之后的下一条指令的地址

image

ret之后回到ViewDidLoad中

image

因此我们可以改写汇编代码保存x30的值

image

从B函数返回后，x0的值变化为0xbbbb,从栈内存中取进入A函数之开始位置时保存的lr的值

图片.png

image

此时从A函数中执行ret执行，CPU能找到回家的路，回到ViewDidLoad方法中进入A函数之后的下一条指令

图片.png

回到ViedDidLoad中的进入A之后的下一条指令ldp x29, x30, [sp, #0x20]

image

可以有另外一种简写形式，中括号中的内容代表从这儿开始寻址
str x30,[sp,#-0x8]!最后面的!不能丢

image

lr(x30)寄存器是64位8字节，若存储x30时，在栈内存中开辟8字节内存，是否可行呢？

image

sp栈里面的操作必须是16字节对齐，否则会导致崩溃

image

函数的参数和返回值

ARM64下,函数的参数是存放在X0到X7(W0到W7)这8个寄存器里面的.如果超过8个参数,就会入栈.
函数的返回值是放在X0 寄存器里面的.

1.查看系统怎么处理参数和返回值

image

返回值存放x0中

image

w0存放10在新开辟的16个字节栈空间的第12个字节往后的4个字节，因为是int型
w1存放20在新开辟的16个字节栈空间的第8个字节往后的位置

image

将w8+w9的值存放在w0中并返回，栈内存空间回收

2.自己实现汇编参数和返回值

image

x0为返回值

图片.png

3.若传入多个参数参数呢，超过八个呢？汇编是如何实现的，且看下篇博客分析

函数的局部变量

函数的局部变量放在栈里面!

最后编辑于：2021.03.31 18:36:28

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,607评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,047评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,496评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,405评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,400评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,479评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,883评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,535评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,743评论 1赞 295
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,544评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,612评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,309评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,881评论 3赞 306
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,891评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,136评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,783评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,316评论 2赞 342

iOS-逆向02-函数本质

关于CPU的补充

寄存器

高速缓存

寄存器的补充

数据地址寄存器

浮点和向量寄存器

栈

SP和FP寄存器

函数调用栈

关于内存读写指令

关于虚拟内存的一张图

死循环会不会崩溃:

堆栈操作练习

bl和ret指令

bl标号

ret

x30寄存器

lr(x30)寄存器是64位8字节，若存储x30时，在栈内存中开辟8字节内存，是否可行呢？

函数的参数和返回值

1.查看系统怎么处理参数和返回值

2.自己实现汇编参数和返回值

3.若传入多个参数参数呢，超过八个呢？汇编是如何实现的，且看下篇博客分析

函数的局部变量

推荐阅读更多精彩内容