图3罗列了桌面体系结构的数据寻址方式。只要将基址的寄存器的值设为0,绝对地址寻址就可以被替换成相对地址寻址。数据寻址的时候,所有的体系结构都会有一个寄存器的值一直是0。类似的,寄存器间接寻址,也可以被替换成偏移是0的偏移寻址,简化寻址方式是RISC的一种特点。(作为CISC的代表,x86有9种寻址方式。)
图3 桌面体系结构的数据寻址方式汇总。 PA-RISC也有短地址的偏移寻址方式。 MIPS64浮点有索引寻址。
图4罗列了嵌入式体系结构支持的寻址方式。不像桌面的RISC,这些嵌入式的不会将一个寄存器的值一直保留0. ARM和SuperH有几种相当复杂的寻址方式。 ARM的一种寻址方式需要按位偏移寄存器里的值,然后把它跟基址相加得到目标地址,从目标地址中取到值回写到目标寄存器。其实就是一种索引寻址,典型就是用在访问数组编译出来的汇编指令。
图4 嵌入式体系结构数据寻址方式汇总。SuperH和M32R支持寄存器间接寻址和寄存器加偏移的寻址模式来取代用0做偏移的寻址。为了访问更大的地址范围,ARM和Thumb在访问半字和字的时候,会对偏移左移1位和2位。
代码执行大多都是PC相关的,比如指针函数调用(回掉函数)之类的特例肯定是少数。在桌面的体系结构中,计算PC相对偏移的时候,会把指令的编码左移两位,然后再与PC相加来取得目的地址。因为桌面的RISC都是32位指令长度,所以指令地址对应的肯定32位对齐,类似的,嵌入式的16位长的指令,肯定是16位对齐,所以左移1位后,再与PC相加。
图5显示桌面RISC指令格式,指令里面还画出了地址的大小。每个指令集都使用4种主要的指令集格式。图6显示了嵌入式RISC的6种指令格式。为了达到16位指令集更高的代码密度,所以才要用到这样更复杂的指令格式。
图K5桌面/服务器RISC指令格式。所有的五种体系结构中都有这个四种指令格式。(图中的上标数字代表它的宽度。)虽然寄存器域的位置在指令中都类似,但是要注意一下是目的寄存器还是源寄存器。OP=操作码,OPX=操作码扩展,RD=目的寄存器,RS1=第一个源寄存器,RS2=第二个源寄存器,CONST=常数(用在立即数或者地址)。有点不一样的是Alpha,在算术和逻辑指令中的立即数域跟数据传输中的不一样。它在bit20到bit13是一个8bit立即数。
图6 嵌入式RISC指令格式。有6种指令格式是五种体系结构都有的。标记的方式跟K5一样。注意分支,跳转和调用指令直接的相似处,还有寄存器和寄存器,寄存器和立即数,以及数据传输的格式之间的差别。引起这些差别的原因有很多,8个或者16个寄存器,2个或者3个操作数,还有指令长度是16位还是32位。
图7和8罗列的是,将指令编码的其中一部分常数,扩展到整个寄存器宽度的值,最典型的就是给一个寄存器赋值一个小的常量值的指令,比如将r2赋值成3。从这个角度看,RISC都很像,但是并不完全相同。
图7桌面的常数扩展汇总。MIPS的跳转和调用指令不是有符号扩展,它的原理是直接替换PC寄存器的低28位。PA-RISC没有立即数逻辑指令。
图8:嵌入式RISC常数扩展汇总。16位长的指令中的立即数比桌面RISC短的多,一般只有5到8位。但是,大多数的嵌入式RISC,可以在用两条指令来拼凑出一个所需的函数调用地址。MIPS不是有符号扩展,它是直接替换PC寄存器的低28位。ARM中的8位立即数可以循环移位出大的立即数,比如所有的2的幂次数,在ARM中都可以用立即数生成。