iOS逆向 02：函数本质（下）

iOS 底层原理 + 逆向文章汇总

本文主要是讲解函数的参数、返回值、局部变量在汇编中是如何存储，以及CPSR标志寄存器

函数的参数和返回值

arm64下，函数的参数是存放在x0-x7（w0-w7）这8个寄存器里面的，如果超过8个参数，就会入栈
- 如果自定义函数时，参数最好不要超过6个（因为有两个隐藏参数 self，_cmd）
- 如果函数需要多个参数，可以传入数组、结构体、指针等类型
函数的返回值放在x0寄存器中
- 如果返回值大于8个字节，就会利用内存传递

查看系统的参数汇编

下面通过系统中对函数的汇编来查看系统对参数、返回值是如何操作的

int sum(int a, int b){
    return a + b;
}
- (void)viewDidLoad{
    [super viewDidLoad];
    sum(10, 20);
}

查看汇编，在跳转到sum函数之前，已经将参数存入了w0、w1

系统的参数汇编-01
在sum函数中，读取w0、w1，放入w8、w9。然后将相加后的结果放入w0（即返回值在w0寄存器）

系统的参数汇编-02

自己优化实现suma

运行发现，其结果与sum函数是一致的,结果都是30

<!--asm.s-->
.text
.global _suma

_suma:
    add x0, x0, x1
    ret 
    
<!--调用-->
int suma;
- (void)viewDidLoad{
    [super viewDidLoad];
    suma(10, 20);
}

编译器优化

来看以下代码的汇编

int test(int a, int b, int c, int d, int e, int f, int g, int h, int i){
    return a + b + c + d + e + f + g + h + i;
}

- (void)viewDidLoad {
    [super viewDidLoad];
    test(1, 2, 3, 4, 5, 6, 7, 8, 9);
}

在test函数断住，查看汇编

未优化分析-01

以下是viewDidLoad栈空间的存入分析过程

未优化分析-02

下图是对汇编代码中入栈过程的一个图示

未优化分析-03
以下是test函数的汇编分析

未优化分析-04

编译器优化

debug模式改成release模式，此时再来查看汇编代码，发现没有test函数，被优化掉了

优化分析-01
如果非要执行test，可以这样写

- (void)viewDidLoad {
    [super viewDidLoad];
    printf("%d", test(1, 2, 3, 4, 5, 6, 7, 8, 9));
}

汇编代码如下，发现优化后的test函数在汇编中，其本质是一个数，也就是test函数的返回值。（相当于将printf("%d", test(1, 2, 3, 4, 5, 6, 7, 8, 9));直接优化成了printf("%d", 45);）

优化分析-02

通过汇编实现函数

定义函数声明及调用

int funcA(int a, int b);

- (void)viewDidLoad {
    [super viewDidLoad];
    int a = funcA(10, 20);
    printf("%d", a);
}

汇编实现funcA

.text
.global _funcA, _sum

_funcA:
    sub sp, sp, #0x10
    stp x29, x30, [sp] //保护lr
    bl _sum
    ldp x29, x30, [sp]
    add sp, sp, #0x10
    ret

_sum:
    add x0, x0, x1
    ret
    
<!--简写-->

_funcA:
    stp x29, x30, [sp, #-0x10]!
    bl _sum
    ldp x29, x30, [sp], #0x10
    ret

_sum:
    add x0, x0, x1
    ret
    
<!--巧合：还可以将bl替换成b-->
//b就是简单跳转,在逆向中用于绕过某些代码（例如安全监测）

_funcA:
    b _sum

_sum:
    add x0, x0, x1
    ret

运行结果如下所示

汇编实现函数结果

说明：

关于b指令：只是跳转，不改变lr寄存器

拉伸栈空间和参数个数有没有关系？：有关系，当参数越多时，如果寄存器放不下，就需要用到内存。就会将栈空间放大，影响栈空间的不仅仅是参数个数，还有局部变量

函数的返回值

如果返回值是一个结构体类型，一个寄存器放不下，这时是什么情况？

有以下代码，运行查看其汇编

struct str {
    int a;
    int b;
    int c;
    int d;
    int f;
    int g;
};
struct Str getStr(int a, int b, int c, int d, int f, int g){
    struct Str str1;
    str1.a = a;
    str1.b = b;
    str1.c = c;
    str1.d = d;
    str1.f = f;
    str1.g = g;
    return str1;
}

- (void)viewDidLoad {
    [super viewDidLoad];
    
    struct Str str2 = getStr(1, 2, 3, 4, 5, 6);
}

断点运行，以下是viewDidLoad函数的汇编

返回值调试-01
以下是getStr函数的汇编代码

返回值调试-02

结论：如果返回值大于x0的8个字节，也会使用栈空间来存储

练习

1、如果函数的参数/返回是9个呢？

struct Str{
    int a;
    int b;
    int c;
    int d;
    int e;
    int f;
    int g;
    int h;
    int i;
};

struct Str getStr(int a, int b, int c, int d, int e, int f, int g, int h, int i){
    struct Str str1;
    str1.a = a;
    str1.b = b;
    str1.c = c;
    str1.d = d;
    str1.e = e;
    str1.f = f;
    str1.g = g;
    str1.h = h;
    str1.i = i;
    return str1;
}

- (void)viewDidLoad {
    [super viewDidLoad];
    
    struct Str str2 = getStr(1, 2, 3, 4, 5, 6, 7, 8, 9);
}

查看viewDidLoad函数汇编

返回值练习-01
查看getStr函数汇编

返回值练习-02

结论：发现前8个参数是存储到寄存器，第9个参数是存储到栈空间

2、如果结构体参数是10个呢？

struct Str{
    int a;
    int b;
    int c;
    int d;
    int e;
    int f;
    int g;
    int h;
    int i;
    int j;
};

struct Str getStr(int a, int b, int c, int d, int e, int f, int g, int h, int i, int j){
    struct Str str1;
    str1.a = a;
    str1.b = b;
    str1.c = c;
    str1.d = d;
    str1.e = e;
    str1.f = f;
    str1.g = g;
    str1.h = h;
    str1.i = i;
    str1.j = j;
    return str1;
}

- (void)viewDidLoad {
    [super viewDidLoad];
    
    struct Str str2 = getStr(1, 2, 3, 4, 5, 6, 7, 8, 9);

查看viewDidLoad函数汇编

返回值练习-03
查看getStr函数汇编

返回值练习-04
- 其中w0-w7都是参数
- x8用于返回值参照
- w9用作临时变量

结论：前8个参数存储到寄存器，后两个参数存储到栈空间

函数的局部变量

函数的局部变量放在栈里面

分析下面代码的汇编

int funcB(int a, int b){
    int c = 6;
    return a + b + c;
}

- (void)viewDidLoad {
    [super viewDidLoad]; 
    funcB(10, 20);
}

查看viewDidLoad的汇编

局部变量-01
查看funcB的汇编

局部变量-02

总结：

局部变量存储在栈空间
参数的传递是用的寄存器，然后将寄存器的值写入栈

如果函数有嵌套调用的情况呢？

int funcB(int a, int b){
    int c = 6;
    int d = funcSum(a, b, c);
    return d;
}

int funcSum(int a, int b, int c){
    int d = a + b + c;
    printf("%d", d);
    return d;
}

- (void)viewDidLoad {
    [super viewDidLoad];
    
    funcB(10, 20);
}

从viewDidLoad到funcB没有任何变化

函数嵌套-01
来看funcB的汇编

函数嵌套-02
- 参数入栈，其实本质也是对参数的一个保护
- 所以使用的参数是从栈中获取，而不是直接通过寄存器获取
- stur 操作4个字节时使用

标记/状态寄存器

标记/状态寄存器：主要用于控制程序的执行流程

引子

分析下面函数的汇编

void func(){
    int a = 1;
    int b = 2;
    
    if (a == b){
        printf("a == b");
    }else{
        printf("error");
    }
}

- (void)viewDidLoad {
    [super viewDidLoad];
    
    func();
}

查看func的汇编

引子-01
手动更改cpsr的值（从1000 -> 0100）

引子-02

输入c执行，此时的输出是 a == b

引子-03

所以，从这里可以说明，高四位（31-28）是有特殊含义的

CPSR

CPU内部的寄存器中，有一种特殊的寄存器（对于不同的处理器，个数和数据结构都可能不同）。这种寄存器在ARM中，被称为状态寄存器，即CPSR（current program status register）寄存器
CPSR和其他寄存器不一样，其他寄存器是用来存放数据的，都是整个寄存器具有一个含义，而CPSR寄存器是按位起作用的，即它的每一位都有专门的含义，用于记录特定的信息
注意：CPSR寄存器是32位的
CPSR的低8位（包括I、F、T和M[4:0]）称为控制位，程序无法修改，除非CPU运行于特权模式下，程序才能修改控制位
中间27-8是保留位，主要作用是为了升级，即更新扩展
N、Z、C、V均为条件码标志位，它们的内容可被算术或逻辑运算的结果所改变，并且可以决定某条指令是否被执行，意义重大！

CPSR图示

N（Negative）标志

CPSR的第31位是N，符号标志位，它记录相关指令执行后，其结果是否为负
- 如果为负，则 N=1
- 如果是非负数，则 N=0
注意：在ARM64的指令集中，有的指令的执行时影响状态寄存器的。例如adds/sub/or等，他们大都是运算指令（用于进行逻辑/算数运算）
- adds 执行add运算，且会改变标志位

案例调试

查看以下代码的汇编

void func(){
     asm(
        "mov w0, #0xffffffff\n"
        "adds w0, w0, #0x0\n"
        );
}
- (void)viewDidLoad {
    [super viewDidLoad];
    
    func();
}

执行mov w0, #0xffffffff：w0赋值-1

N调试-01

查看此时的cpsr，高4位是6（即0110）

N调试-02
执行adds w0, w0, #0x0：因为w0位负数，加上0x0后，仍为负数，所以N标志为1

N调试-03

从cpsr的值中可以看出，6变成了8，即 0110 -> 1000,N位从0变成了1，符合我们的预期

Z（zero）标志

CPSR的第30位是Z，0标志位，它记录相关指令执行后，其结果是否为0
- 如果结果为0，则 Z=1（此时能确定前面两位为01，即N非负，为0，z为1）
- 如果结果不为0，则 Z=0

对于Z的值，可以这样看，Z标记相关指令的计算结果是否为0，如果为0，则Z要记录下”是0“这样的肯定信息。在计算机中1表示逻辑真，表示肯定，所以当结果为0时Z=1（表示”结果为0“）。如果结果不为0，则Z要记录下”不是0“这样的否定信息。在计算机中0表示逻辑假，表示否定，所以当结果不为0时Z=0，表示”结果不为0“

案例调试

目的：验证z为1时，N必为0

void func(){
    asm(
        "mov w0, #0x0\n"
        "adds w0, w0, #0x0\n"
    );
}

查看此时的CPSR

Z调试-01
执行mov w0, #0x0 和 adds w0, w0, #0x0，发现N和Z仍然是0和1
修改：将adds中的0x0更改为0x1

void func(){
    asm(
        "mov w0, #0x0\n"
        "adds w0, w0, #0x1\n"
    );
}

查看CPSR，从图中可以看出，由于为结果为非负数，所以N为0，同时也不为0，则Z为0

Z调试-02

C（Carry）标志

CPSR的第29位是C，进位标志位，一般情况下，进行无符号数的运算
加法运算：当运算结果产生了进位时（无符号溢出），则C=1，否则C=0
- 例如 1111 1111 + 1 --> 1 0000 0000，此时的1就保存在C标志位
减法运算（包括CMP）：当运算时产生了借位时（无符号数溢出），C=0，否则C=1

C图示
- 例如 0000 0001 - 0000 0010 --> 1111 1111，

对于位数为N的无符号数来说，其对应的二进制信息的最高位，即第N-1位，就是它的最高有效位，而假想存在的第N位，就是相对于最高有效位的更高位，如下所示

无符号的C图示

进位

当两个数相加时，有可能产生从最高有效位向更高位的进位，例如两个32位数据0xaaaaaaaa + 0xaaaaaaaa，将产生进位，由于这个进位值在32位中无法保存，就说这个进位值丢失了。其实CPU在运算时，并不丢弃这个进位制，而是记录在一个特殊的寄存器的某一位上，ARM下就用C位来记录这个进位值，例如下面的指令

mov w0,#0xaaaaaaaa；0xa 的二进制是 1010
adds w0,w0,w0； 执行后 相当于 1010 << 1 进位1（无符号溢出） 所以C标记 为 1
adds w0,w0,w0； 执行后 相当于 0101 << 1 进位0（无符号没溢出） 所以C标记 为 0
adds w0,w0,w0； 重复上面操作
adds w0,w0,w0

首先将CPSR变成0x00000000，然后查看执行mov w0,#0xaaaaaaaa后的CPSR

进位调试-01
执行第一次adds w0,w0,w0：进位1，C为1

进位调试-02
执行第二次adds w0,w0,w0：无进位，C由1变成0

进位调试-03
执行第三次adds w0,w0,w0：有进位，0变成1

进位调试-04
执行第四次adds w0,w0,w0，无进位，1变成0

进位调试-05

借位

当两个数据做减法时，有可能向更高位借位，例如，两个32位数据0x00000000 - 0x000000ff，将产生借位，借位后，相当于计算0x100000000 - 0x000000ff，得到0xffffff01这个值，由于借了一位，所以C位用来标记借位。C=0，例如下面的指令

mov w0,#0x0
subs w0,w0,#0xff
subs w0,w0,#0xff
subs w0,w0,#0xff

将CPSR修改为0x00000000，执行mov w0,#0x0

借位调试-01
执行第一次subs w0,w0,#0xff：产生了借位，所以C=0

借位调试-02
执行第二次subs w0,w0,#0xff：无借位，所以C=1

借位调试-03
执行第三次subs w0,w0,#0xff：无借位，所以C=1

借位调试-04

总结

函数参数
- arm64中，参数是放在x0-x7的8个寄存器中
- 如果是浮点数，就会用浮点数寄存器
- 如果超过8个参数就会用栈传递
函数返回值
- 一般函数的返回值使用x0寄存器保存
- 如果返回值大于了8个字节（x0寄存器大小是8个字节），就会利用内存传递返回值
函数局部变量
- 局部变量存储在栈空间
函数的嵌套调用：会将x29、x30寄存器入栈保护
状态（标志）寄存器 - CPSR
- arm64中cpsr寄存器（32位）为状态寄存器
- 最高4位（28、29、30、31）为标志位
  - N标志（负标记位）
    - 执行结果为负数N=1
    - 执行结果非负数N=0
  - Z标志（0标记位）
    - 结果为0则Z=1
    - 结果非0则Z=0
  - C标志（无符号溢出）
    - 加法：进位 C=1，否则C=0
    - 减法：借位 C=0，否则C=1
  - V标志（有符号溢出）
    - 正数+正数=负数，则V=1
    - 正数+负数=正数，则V=0

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 205,033评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,725评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,473评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,846评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,848评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,691评论 1赞 282
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,053评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,700评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 42,856评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,676评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,787评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,430评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,034评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,990评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,218评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,174评论 2赞 352
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,526评论 2赞 343