iOS逆向 02:函数本质(下)

iOS 底层原理 + 逆向 文章汇总

本文主要是讲解函数的参数返回值局部变量在汇编中是如何存储,以及CPSR标志寄存器

函数的参数和返回值

  • arm64下,函数的参数是存放在x0-x7(w0-w7)这8个寄存器里面的,如果超过8个参数,就会入栈

    • 如果自定义函数时,参数最好不要超过6个(因为有两个隐藏参数 self,_cmd

    • 如果函数需要多个参数,可以传入数组、结构体、指针等类型

  • 函数的返回值放在x0寄存器

    • 如果返回值大于8个字节,就会利用内存传递

查看系统的参数汇编

下面通过系统中对函数的汇编来查看系统对参数、返回值是如何操作的

int sum(int a, int b){
    return a + b;
}
- (void)viewDidLoad{
    [super viewDidLoad];
    sum(10, 20);
}
  • 查看汇编,在跳转到sum函数之前,已经将参数存入了w0、w1


    系统的参数汇编-01
  • 在sum函数中,读取w0、w1,放入w8、w9。然后将相加后的结果放入w0(即返回值在w0寄存器)


    系统的参数汇编-02

自己优化实现suma

运行发现,其结果与sum函数是一致的,结果都是30

<!--asm.s-->
.text
.global _suma

_suma:
    add x0, x0, x1
    ret 
    
<!--调用-->
int suma;
- (void)viewDidLoad{
    [super viewDidLoad];
    suma(10, 20);
}

编译器优化

来看以下代码的汇编

int test(int a, int b, int c, int d, int e, int f, int g, int h, int i){
    return a + b + c + d + e + f + g + h + i;
}

- (void)viewDidLoad {
    [super viewDidLoad];
    test(1, 2, 3, 4, 5, 6, 7, 8, 9);
}
  • 在test函数断住,查看汇编

    未优化分析-01

    以下是viewDidLoad栈空间的存入分析过程
    未优化分析-02

    下图是对汇编代码中入栈过程的一个图示
    未优化分析-03

  • 以下是test函数的汇编分析

    未优化分析-04

编译器优化

  • debug模式改成release模式,此时再来查看汇编代码,发现没有test函数,被优化掉了


    优化分析-01
  • 如果非要执行test,可以这样写

- (void)viewDidLoad {
    [super viewDidLoad];
    printf("%d", test(1, 2, 3, 4, 5, 6, 7, 8, 9));
}

汇编代码如下,发现优化后的test函数在汇编中,其本质是一个,也就是test函数的返回值。(相当于将printf("%d", test(1, 2, 3, 4, 5, 6, 7, 8, 9));直接优化成了printf("%d", 45);

优化分析-02

通过汇编实现函数

  • 定义函数声明及调用
int funcA(int a, int b);

- (void)viewDidLoad {
    [super viewDidLoad];
    int a = funcA(10, 20);
    printf("%d", a);
}
  • 汇编实现funcA
.text
.global _funcA, _sum

_funcA:
    sub sp, sp, #0x10
    stp x29, x30, [sp] //保护lr
    bl _sum
    ldp x29, x30, [sp]
    add sp, sp, #0x10
    ret

_sum:
    add x0, x0, x1
    ret
    
<!--简写-->

_funcA:
    stp x29, x30, [sp, #-0x10]!
    bl _sum
    ldp x29, x30, [sp], #0x10
    ret

_sum:
    add x0, x0, x1
    ret
    
<!--巧合:还可以将bl替换成b-->
//b就是简单跳转,在逆向中用于绕过某些代码(例如安全监测)

_funcA:
    b _sum

_sum:
    add x0, x0, x1
    ret

运行结果如下所示


汇编实现函数结果

说明:

  • 关于b指令:只是跳转,不改变lr寄存器
  • 拉伸栈空间和参数个数有没有关系?:有关系,当参数越多时,如果寄存器放不下,就需要用到内存。就会将栈空间放大,影响栈空间的不仅仅是参数个数,还有局部变量

函数的返回值

如果返回值是一个结构体类型,一个寄存器放不下,这时是什么情况?

有以下代码,运行查看其汇编

struct str {
    int a;
    int b;
    int c;
    int d;
    int f;
    int g;
};
struct Str getStr(int a, int b, int c, int d, int f, int g){
    struct Str str1;
    str1.a = a;
    str1.b = b;
    str1.c = c;
    str1.d = d;
    str1.f = f;
    str1.g = g;
    return str1;
}

- (void)viewDidLoad {
    [super viewDidLoad];
    
    struct Str str2 = getStr(1, 2, 3, 4, 5, 6);
}
  • 断点运行,以下是viewDidLoad函数的汇编
    返回值调试-01
  • 以下是getStr函数的汇编代码


    返回值调试-02

结论:如果返回值大于x0的8个字节,也会使用栈空间来存储

练习

1、如果函数的参数/返回是9个呢?

struct Str{
    int a;
    int b;
    int c;
    int d;
    int e;
    int f;
    int g;
    int h;
    int i;
};

struct Str getStr(int a, int b, int c, int d, int e, int f, int g, int h, int i){
    struct Str str1;
    str1.a = a;
    str1.b = b;
    str1.c = c;
    str1.d = d;
    str1.e = e;
    str1.f = f;
    str1.g = g;
    str1.h = h;
    str1.i = i;
    return str1;
}

- (void)viewDidLoad {
    [super viewDidLoad];
    
    struct Str str2 = getStr(1, 2, 3, 4, 5, 6, 7, 8, 9);
}
  • 查看viewDidLoad函数汇编

    返回值练习-01

  • 查看getStr函数汇编

    返回值练习-02

    结论:发现前8个参数是存储到寄存器,第9个参数是存储到栈空间

2、如果结构体参数是10个呢?

struct Str{
    int a;
    int b;
    int c;
    int d;
    int e;
    int f;
    int g;
    int h;
    int i;
    int j;
};

struct Str getStr(int a, int b, int c, int d, int e, int f, int g, int h, int i, int j){
    struct Str str1;
    str1.a = a;
    str1.b = b;
    str1.c = c;
    str1.d = d;
    str1.e = e;
    str1.f = f;
    str1.g = g;
    str1.h = h;
    str1.i = i;
    str1.j = j;
    return str1;
}

- (void)viewDidLoad {
    [super viewDidLoad];
    
    struct Str str2 = getStr(1, 2, 3, 4, 5, 6, 7, 8, 9);
  • 查看viewDidLoad函数汇编

    返回值练习-03

  • 查看getStr函数汇编

    返回值练习-04

    • 其中w0-w7都是参数
    • x8用于返回值参照
    • w9用作临时变量

结论:前8个参数存储到寄存器,后两个参数存储到栈空间

函数的局部变量

  • 函数的局部变量放在里面

分析下面代码的汇编

int funcB(int a, int b){
    int c = 6;
    return a + b + c;
}

- (void)viewDidLoad {
    [super viewDidLoad]; 
    funcB(10, 20);
}
  • 查看viewDidLoad的汇编

    局部变量-01

  • 查看funcB的汇编

    局部变量-02

总结

  • 局部变量存储在空间
  • 参数的传递是用的寄存器,然后将寄存器的值写入栈

如果函数有嵌套调用的情况呢?

int funcB(int a, int b){
    int c = 6;
    int d = funcSum(a, b, c);
    return d;
}

int funcSum(int a, int b, int c){
    int d = a + b + c;
    printf("%d", d);
    return d;
}

- (void)viewDidLoad {
    [super viewDidLoad];
    
    funcB(10, 20);
}
  • 从viewDidLoad到funcB没有任何变化


    函数嵌套-01
  • 来看funcB的汇编


    函数嵌套-02
    • 参数入栈,其实本质也是对参数的一个保护
    • 所以使用的参数是从栈中获取,而不是直接通过寄存器获取
    • stur 操作4个字节时使用

标记/状态寄存器

标记/状态寄存器:主要用于控制程序的执行流程

引子

分析下面函数的汇编

void func(){
    int a = 1;
    int b = 2;
    
    if (a == b){
        printf("a == b");
    }else{
        printf("error");
    }
}

- (void)viewDidLoad {
    [super viewDidLoad];
    
    func();
}
  • 查看func的汇编
    引子-01
  • 手动更改cpsr的值(从1000 -> 0100)
    引子-02

    输入c执行,此时的输出是 a == b
    引子-03

    所以,从这里可以说明,高四位(31-28)是有特殊含义的

CPSR

  • CPU内部的寄存器中,有一种特殊的寄存器(对于不同的处理器,个数和数据结构都可能不同)。这种寄存器在ARM中,被称为状态寄存器,即CPSR(current program status register)寄存器

  • CPSR和其他寄存器不一样,其他寄存器是用来存放数据的,都是整个寄存器具有一个含义,而CPSR寄存器是按位起作用的,即它的每一位都有专门的含义,用于记录特定的信息

  • 注意:CPSR寄存器是32位

  • CPSR的低8位(包括I、F、T和M[4:0])称为控制位程序无法修改,除非CPU运行于特权模式下,程序才能修改控制位

  • 中间27-8是保留位,主要作用是为了升级,即更新扩展

  • N、Z、C、V均为条件码标志位,它们的内容可被算术或逻辑运算的结果所改变,并且可以决定某条指令是否被执行,意义重大!

    CPSR图示

N(Negative)标志

  • CPSR的第31位是N符号标志位,它记录相关指令执行后,其结果是否为负
    • 如果为负,则 N=1

    • 如果是非负数,则 N=0

  • 注意:在ARM64的指令集中,有的指令的执行时影响状态寄存器的。例如adds/sub/or等,他们大都是运算指令(用于进行逻辑/算数运算)
    • adds 执行add运算,且会改变标志位

案例调试

查看以下代码的汇编

void func(){
     asm(
        "mov w0, #0xffffffff\n"
        "adds w0, w0, #0x0\n"
        );
}
- (void)viewDidLoad {
    [super viewDidLoad];
    
    func();
}
  • 执行mov w0, #0xffffffff:w0赋值-1

    N调试-01

    查看此时的cpsr,高4位是6(即0110)
    N调试-02

  • 执行adds w0, w0, #0x0:因为w0位负数,加上0x0后,仍为负数,所以N标志为1

    N调试-03

    从cpsr的值中可以看出,6变成了8,即 0110 -> 1000,N从0变成了1,符合我们的预期

Z(zero)标志

  • CPSR的第30位是Z,0标志位,它记录相关指令执行后,其结果是否为0
    • 如果结果为0,则 Z=1(此时能确定前面两位为01,即N非负,为0,z为1)

    • 如果结果不为0,则 Z=0

对于Z的值,可以这样看,Z标记相关指令的计算结果是否为0,如果为0,则Z要记录下”是0“这样的肯定信息。在计算机中1表示逻辑真,表示肯定,所以当结果为0时Z=1(表示”结果为0“)。如果结果不为0,则Z要记录下”不是0“这样的否定信息。在计算机中0表示逻辑假,表示否定,所以当结果不为0时Z=0,表示”结果不为0“

案例调试

目的:验证z为1时,N必为0

void func(){
    asm(
        "mov w0, #0x0\n"
        "adds w0, w0, #0x0\n"
    );
}
  • 查看此时的CPSR

    Z调试-01

  • 执行mov w0, #0x0adds w0, w0, #0x0,发现N和Z仍然是0和1

  • 修改:将adds中的0x0更改为0x1

void func(){
    asm(
        "mov w0, #0x0\n"
        "adds w0, w0, #0x1\n"
    );
}

查看CPSR,从图中可以看出,由于为结果为非负数,所以N为0,同时也不为0,则Z为0

Z调试-02

C(Carry)标志

  • CPSR的第29位是C进位标志位,一般情况下,进行无符号数的运算

  • 加法运算:当运算结果产生了进位时(无符号溢出),则C=1,否则C=0

    • 例如 1111 1111 + 1 --> 1 0000 0000,此时的1就保存在C标志位
  • 减法运算(包括CMP):当运算时产生了借位时(无符号数溢出),C=0,否则C=1

    C图示

    • 例如 0000 0001 - 0000 0010 --> 1111 1111,

对于位数为N的无符号数来说,其对应的二进制信息的最高位,即第N-1位,就是它的最高有效位,而假想存在的第N位,就是相对于最高有效位的更高位,如下所示


无符号的C图示
进位

当两个数相加时,有可能产生从最高有效位向更高位的进位,例如两个32位数据0xaaaaaaaa + 0xaaaaaaaa,将产生进位,由于这个进位值在32位中无法保存,就说这个进位值丢失了。其实CPU在运算时,并不丢弃这个进位制,而是记录在一个特殊的寄存器的某一位上,ARM下就用C位来记录这个进位值,例如下面的指令

mov w0,#0xaaaaaaaa;0xa 的二进制是 1010
adds w0,w0,w0; 执行后 相当于 1010 << 1 进位1(无符号溢出) 所以C标记 为 1
adds w0,w0,w0; 执行后 相当于 0101 << 1 进位0(无符号没溢出) 所以C标记 为 0
adds w0,w0,w0; 重复上面操作
adds w0,w0,w0
  • 首先将CPSR变成0x00000000,然后查看执行mov w0,#0xaaaaaaaa后的CPSR

    进位调试-01

  • 执行第一次adds w0,w0,w0:进位1,C为1

    进位调试-02

  • 执行第二次adds w0,w0,w0:无进位,C由1变成0

    进位调试-03

  • 执行第三次adds w0,w0,w0:有进位,0变成1

    进位调试-04

  • 执行第四次adds w0,w0,w0,无进位,1变成0

    进位调试-05

借位

当两个数据做减法时,有可能向更高位借位,例如,两个32位数据0x00000000 - 0x000000ff,将产生借位,借位后,相当于计算0x100000000 - 0x000000ff,得到0xffffff01这个值,由于借了一位,所以C位用来标记借位。C=0,例如下面的指令

mov w0,#0x0
subs w0,w0,#0xff
subs w0,w0,#0xff
subs w0,w0,#0xff
  • 将CPSR修改为0x00000000,执行mov w0,#0x0

    借位调试-01

  • 执行第一次subs w0,w0,#0xff:产生了借位,所以C=0

    借位调试-02

  • 执行第二次subs w0,w0,#0xff:无借位,所以C=1

    借位调试-03

  • 执行第三次subs w0,w0,#0xff:无借位,所以C=1

    借位调试-04

总结

  • 函数参数

    • arm64中,参数是放在x0-x7的8个寄存器中

    • 如果是浮点数,就会用浮点数寄存器

    • 如果超过8个参数就会用栈传递

  • 函数返回值

    • 一般函数的返回值使用x0寄存器保存

    • 如果返回值大于了8个字节(x0寄存器大小是8个字节),就会利用内存传递返回值

  • 函数局部变量

    • 局部变量存储在空间
  • 函数的嵌套调用:会将x29、x30寄存器入栈保护

  • 状态(标志)寄存器 - CPSR

    • arm64中cpsr寄存器(32位)为状态寄存器

    • 最高4位(28、29、30、31)为标志位

      • N标志(负标记位)
        • 执行结果为负数N=1

        • 执行结果非负数N=0

      • Z标志(0标记位)
        • 结果为0则Z=1

        • 结果非0则Z=0

      • C标志(无符号溢出)
        • 加法:进位 C=1,否则C=0

        • 减法:借位 C=0,否则C=1

      • V标志(有符号溢出)
        • 正数+正数=负数,则V=1

        • 正数+负数=正数,则V=0

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,033评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,725评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,473评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,846评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,848评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,691评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,053评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,700评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,856评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,676评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,787评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,430评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,034评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,990评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,218评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,174评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,526评论 2 343

推荐阅读更多精彩内容