iOS汇编基础（二）寄存器

以arm64为例

xcode调试汇编

1. xcode 查看运行时的汇编代码

debug -> debug workflow -> always showdisassembly

2. Xcode改变pc值

register write pc 0x1005d6928

3. 单步运行一步汇编代码：ni

4. 读取某个寄存器

(lldb) register read x0
      x0 = 0x0000000000000000
(lldb)

5. 进入某个汇编函数

按住control+Xcode的下箭头键

6. 新建汇编文件或内嵌汇编代码

新建：command+N 然后选择assembly file
内嵌：

int main(int argc, char * argv[]) {
    asm(
        "mov w0,#0x0\n"
        "adds w0,w0,#0x1\n"
        );
    return 0;
}

一通用寄存器

ARM64拥有有31个64位的通用寄存器 x0 到 x30,这些寄存器通常用来存放一般性的数据，称为通用寄存器（有时也有特定用途）
那么w0 到 w28 这些是32位的. 因为64位CPU可以兼容32位.所以可以只使用64位寄存器的低32位.
比如 w0 就是 x0的低32位!

Xcode查看寄存器：

屏幕快照 2018-04-24 下午11.13.22.png

通常，CPU会先将内存中的数据存储到通用寄存器中，然后再对通用寄存器中的数据进行运算。
假设内存中有块红色内存空间的值是3，现在想把它的值加1，并将结果存储到蓝色内存空间
- CPU首先会将红色内存空间的值放到X0寄存器中：mov X0,红色内存空间
- 然后让X0寄存器与1相加：add X0,1
- 最后将值赋值给内存空间：mov 蓝色内存空间,X0

二 pc寄存器(program counter)

为指令指针寄存器，它指示了CPU当前要读取指令的地址
在内存或者磁盘上，指令和数据没有任何区别，都是二进制信息
CPU在工作的时候把有的信息看做指令，有的信息看做数据，为同样的信息赋予了不同的意义
- 比如 1110 0000 0000 0011 0000 1000 1010 1010
- 可以当做数据 0xE003008AA
- 也可以当做指令 mov x0, x8
CPU根据什么将内存中的信息看做指令？
- CPU将pc指向的内存单元的内容看做指令
- 如果内存中的某段内容曾被CPU执行过，那么它所在的内存单元必然被pc指向过

三 bl指令

ARM64提供了另外的指令来修改PC的值，这些指令统称为转移指令，最简单的是bl指令。

CPU从何处执行指令是由pc中的内容决定的，我们可以通过改变pc的内容来控制CPU执行目标指令
ARM64提供了一个mov指令（传送指令），可以用来修改大部分寄存器的值，比如
mov x0,#10、mov x1,#20
ARM64提供bl指令来修改PC的值

四数据地址寄存器

数据地址寄存器通常用来做数据计算的临时存储、做累加、计数、地址保存等功能。定义这些寄存器的作用主要是用于在CPU指令中保存操作数，在CPU中当做一些常规变量来使用。
ARM64中

64位: X0-X30, XZR(零寄存器)
32位: W0-W30, WZR(零寄存器)

注意:
之前讲解8086汇编中有一种特殊的寄存器段寄存器:CS,DS,SS,ES四个寄存器来保存这些段的基地址,这个属于Intel架构CPU中.在ARM中并没有

五浮点和向量寄存器

因为浮点数的存储以及其运算的特殊性,CPU中专门提供浮点数寄存器来处理浮点数

浮点寄存器 64位: D0 - D31 32位: S0 - S31

现在的CPU支持向量运算.(向量运算在图形处理相关的领域用得非常的多)为了支持向量计算系统了也提供了众多的向量寄存器.

向量寄存器 128位:V0-V31

590B7934-C13F-4E0A-8120-BB01CAD64E18.png

六一些特殊寄存器

1. 参数：x0 -- x7(个数有关系、数据类型也有关，比如浮点寄存器等)多余的就会入栈

2. lr(x30)保存下一条指令地址，bl会跳转到x30指向的地址去执行代码

3. sp寄存器：sp拉伸栈空间（16的倍数）

4. fp寄存器也称为x29寄存器属于通用寄存器,但是在某些时刻我们利用它保存栈底的地址!()

注意:ARM64开始,取消32位的 LDM,STM,PUSH,POP指令! 取而代之的是ldr\ldp str\stp

4. ret 返回到lr寄存器所保存的地址执行代码，返回值储存到x0中

七 CPSR(current program status register)状态寄存器

CPSR和其他寄存器不一样,其他寄存器是用来存放数据的,都是整个寄存器具有一个含义.而CPSR寄存器是按位起作用的,也就是说,它的每一位都有专门的含义,记录特定的信息.

注:CPSR寄存器是32位的

CPSR的低8位（包括I、F、T和M[4：0]）称为控制位，程序无法修改,除非CPU运行于特权模式下,程序才能修改控制位!
N、Z、C、V均为条件码标志位。它们的内容可被算术或逻辑运算的结果所改变，并且可以决定某条指令是否被执行

1. N（Negative）标志

N，符号标志位。
它记录相关指令执行后,其结果是为负 N = 1,如果是非负数 N = 0.

注意,在ARM64的指令集中,有的指令的执行时影响状态寄存器的,比如add\sub\or等,他们大都是运算指令(进行逻辑或算数运算)；

2. Z(Zero)标志

Z，0标志位。
它记录相关指令执行后,其结果是为0. 那么Z = 1.如果结果不为0,那么Z = 0.

3. C(Carry)标志

C，进位标志位。[图片上传中...(15201651736312.jpg-68cfc1-1524662058998-0)]
一般情况下,进行无符号数的运算。
加法运算：当运算结果产生了进位时（无符号数溢出），C=1，否则C=0。
减法运算（包括CMP）：当运算时产生了借位时（无符号数溢出），C=0，否则C=1。

对于位数为N的无符号数来说，其对应的二进制信息的最高位，即第N - 1位，就是它的最高有效位，而假想存在的第N位，就是相对于最高有效位的更高位。如下图所示：

进位

我们知道，当两个数据相加的时候，有可能产生从最高有效位向更高位的进位。比如两个32位数据：0xaaaaaaaa + 0xaaaaaaaa,将产生进位。由于这个进位值在32位中无法保存，我们就只是简单的说这个进位值丢失了。其实CPU在运算的时候，并不丢弃这个进位制，而是记录在一个特殊的寄存器的某一位上。ARM下就用C位来记录这个进位值。比如，下面的指令

mov w0,#0xaaaaaaaa；0xa 的二进制是 1010
adds w0,w0,w0； 执行后 相当于 1010 << 1 进位1（无符号溢出） 所以C标记 为 1
adds w0,w0,w0； 执行后 相当于 0101 << 1 进位0（无符号没溢出） 所以C标记 为 0
adds w0,w0,w0； 重复上面操作
adds w0,w0,w0

借位

当两个数据做减法的时候，有可能向更高位借位。再比如，两个32位数据：0x00000000 - 0x000000ff,将产生借位，借位后，相当于计算0x100000000 - 0x000000ff。得到0xffffff01 这个值。由于借了一位，所以C位用来标记借位。C = 0.比如下面指令：

mov w0,#0x0
subs w0,w0,#0xff ;
subs w0,w0,#0xff
subs w0,w0,#0xff

4. V(Overflow)溢出标志

CPSR的第28位是V，溢出标志位。在进行有符号数运算的时候，如果超过了机器所能标识的范围，称为溢出。

正数 + 正数为负数溢出
负数 + 负数为正数溢出
正数 + 负数不可能溢出

八函数的本质

函数的本质就是函数调用栈，只要调用函数，就会开辟栈空间。发生函数调用时，sp拉伸栈空间，函数的参数是存放在X0到X7(W0到W7)这8个寄存器里面的.如果超过8个参数,就会入栈，局部变量也入栈，x29和x30也要入栈以便bl跳转回来能找到下一条指令继续执行,如果是叶子函数，则不用保存x29和x30。函数的返回值是放在X0 寄存器里面的。所以拉伸栈空间的大小和参数，局部变量以及x29和x30有关。

1. 栈：是一种具有特殊的访问方式的存储空间（后进先出， Last In Out Firt，LIFO）

sp寄存器在任意时刻会保存我们栈顶的地址，fp寄存器也称为x29寄存器属于通用寄存器,但是在某些时刻我们利用它保存栈底的地址!

2. 内存读写指令

注意:读/写数据是都是往高地址读/写

str(store register)指令
将数据从寄存器中读出来,存到内存中.
ldr(load register)指令
将数据从内存中读出来,存到寄存器中
此ldr 和 str 的变种ldp 和 stp 还可以操作2个寄存器.

使用32个字节空间作为这段程序的栈空间,然后利用栈将x0和x1的值进行交换.代码如下：

sub    sp, sp, #0x20    ;拉伸栈空间32个字节
stp    x0, x1, [sp, #0x10] ;sp往上加16个字节,存放x0 和 x1
ldp    x1, x0, [sp, #0x10] ;将sp偏移16个字节的值取出来,放入x1 和 x0