先奉上别人的一篇帖子
ARM的工作状态
从编程的角度看,ARM微处理器的工作状态一般有两种,并可在两种状态之间切换:
1)第一种为ARM状态,此时处理器执行32的字对齐ARM指令,绝大部分工作在此状态;
2)第二种为Thumb状态,此时处理器执行16位的、半字对齐的Thumb指令。
ARM微处理器有32位的ARM指令集和16位的Thumb指令集,微处理器可以随时在两种工作状态之间切换,并且,处理器工作状态的转变并不影响处理器的工作模式和相应寄存器中的内容。
ARM语法不是很复杂,知道一些大体的语法和指令就可以了
ARM指令分为寻址方式、寄存器、常用指令,了解这三个知识点,就会对ARM指令有一个大体的了解。
1. ARM指令中的寻址方式
寻址方式就是确定本条指令的操作数地址或者是下一条要执行指令的指令地址
换句话来说寻址方式就是如何找到指令或者是数据的地址
从指令或者数据的角度来说,可以把寻址方式划分成两类指令寻址和数据寻址
'''
1. 立即数寻址
立即数寻址也叫立即寻址,是一种特殊的寻址方式.
操作数本身包含在指令中,只要取出指令也就取到了操作数.
这个操作数叫做立即数,对应的寻址方式叫作立即寻址.
例如:
MOV R0, #64; R0 ← 64
-----------------------------------------------------------------------
2. 寄存器寻址
寄存器寻址是利用寄存器中的数值作为操作数,也称为寄存器直接寻址.
例如:
ADD R0, R1, R2 ; R0 ← R1+R2
-----------------------------------------------------------------------
3. 寄存器间接寻址
寄存器间接寻址就是把寄存器中的值作为地址,
再通过这个地址去取得操作数,操作数本身存放在存储器中.
例如:
LDR R0, [R1] ; R0 ← [R1]
-----------------------------------------------------------------------
4. 寄存器偏移寻址
这是ARM指令集特有的寻址方式,
它是在寄存器寻址得到操作数后再进行移位操作,得到最终的操作数.
例如:
MOV R0, R2, LSL #3 ; R0 ← R2*8
(注释:R2的值左移3位,结果赋给R0.)
-----------------------------------------------------------------------
5. 寄存器基址变址寻址
又称为基址变址寻址,是在寄存器间接寻址的基础上扩展来的.
它将寄存器(该寄存器一般称作基址寄存器)中的值与指令中给出的地址偏移量相加,
从而得到一个地址,通过这个地址取得操作数.
例如:
LDR R0, [R1, #4]; R0 ← [R1+4]
(注释:将R1的内容加上4形成操作数地址,取得的操作数存入寄存器R0中.)
-----------------------------------------------------------------------
6. 多寄存器寻址
这种寻址方式可以一次完成多个寄存器值的传送.
例如:
LDMIA R0, (R1, R2, R3, R4) ; R1←[R0], R2←[R0+4], R3←[R0+8], R4←[R0+12]
-----------------------------------------------------------------------
7. 堆栈寻址
堆栈是一种数据结构,按先进后出(First In Last Out, FILO)的方式工作,
使用堆栈指针(Stack Pointer, SP)指示当前的操作位置,堆栈指针总是指向栈顶.
例如:
STMFD SP! , | R1-R7, LR | (将R1~R7, LR压入堆栈,满递减堆栈)
LDMED SP! , | R1-R7, LR | (将堆栈中的数据取回到R1~R7, LR寄存器。空递减堆栈)
'''
2. ARM中的寄存器
我这里插播一条知识
寄存器的意思是CPU里面会有少量的内存这个叫寄存器,差不多像RAM的意思,
它们可用来暂存指令、数据和地址
因为CPU计算出来的数据会太快,所以来不及转换到RAM
更不会与硬盘(磁盘)频繁的进行数据交换
所以数据会暂时放在寄存器的这个地方,然后再通过某些命令,进行数据的交换
比如:
指令MOV: 在寄存器和RAM之间移动数据
+---------------------------------------------------------------------------------------------------------+
| R0 | R1 | R2 | R3 | R4 | R5 | R6 | R7 | R8 | R9 | R10 | R11 | R12 (IP) | R13 (SP) | R14 (LR) | R15 (PC) |
+---------------------------------------------------------------------------------------------------------+
| | |
R13:(stack pointer),是栈顶指针____/ | |
| |
R14:(link register),存放函数的返回地址____/ |
|
R15:(program counter),指向当前指令地址____/
'''
R0-R3:用于函数参数及返回值的传递.
R4-R6, R8, R10-R11:没有特殊规定,就是普通的通用寄存器.
R7:栈帧指针(Frame Pointer),指向前一个保存的栈帧(stack frame)和链接寄存器 (link register, Ir)在栈上的地址.
R9:操作系统保留.
R12:又叫IP (intra-procedure scratch).
R13:又叫SP (stack pointer),是栈顶指针.
R14:又叫LR (link register),存放函数的返回地址.
R15: 又叫PC (program counter),指向当前指令地址.
'''
3. ARM中的常用指令含义
MOV: "在寄存器和RAM之间移动数据,使用方法MOV [目标地址][源地址] mov r1, r2"
ADD: "加指令"
SUB: "减指令"
LDR: "把栈(内存)上内容载入一寄存器(CPU里面的内存)中"
STR: "把寄存器(CPU里面的内存)内容存到栈(内存)上去"
.w: "是一个可选的指令宽度说明符.它不会影响为此指令的行为,它只是确保生成32位指令."
BL: "执行函数调用,并把使lr指向调用者(caller)的下一条指令,即函数的返回地址"
BLX: "同上,但是在ARM和thumb指令集间切换"
CMP: "比较两个值"
拓展阅读. ARM指令简单代码段分析
c代码:
#include <stdio.h>
int func( int a, int b, int c, int d, int e, int f )
{
int g = a + b + c + d + e + f;
return g;
}
"""
对应的ARM指令:
add r0, r1; 将参数a和参数b相加再把结果赋值给r0
ldr.w r12, [sp]; 把最后的一个参数f从栈上装载到r12寄存器
add r0, r2; 把参数c累加到r0上
ldr.w r9, [sp, #4]; 把参数e从栈上装载到r9寄存器
add r0, r3; 累加d累加到r0
add r0, r12; 累加参数f到r0
add r0, r9 ; 累加参数e到r0
func(int, int, int, int, int, int):
push {r11, lr}
mov r11, sp
sub sp, sp, #20
ldr r12, [r11, #12]
ldr lr, [r11, #8]
str r0, [r11, #-4]
str r1, [r11, #-8]
str r2, [sp, #8]
str r3, [sp, #4]
ldr r0, [r11, #-4]
ldr r1, [r11, #-8]
add r0, r0, r1
ldr r1, [sp, #8]
add r0, r0, r1
ldr r1, [sp, #4]
add r0, r0, r1
ldr r1, [r11, #8]
add r0, r0, r1
ldr r1, [r11, #12]
add r0, r0, r1
str r0, [sp]
ldr r0, [sp]
mov sp, r11
pop {r11, lr}
bx lr
"""
在IDA中的偏移地址说明
"""
[SP,#0x538+jstr2]
这条寻址结果就是
SP+0x538+jstr2
意思就是寄存器SP的值加上0x538,再加上jstr2的一个偏移
已知jstr2=-0x51C
所以最后栈中的内存是
SP+0x538-0x51C
"""