任何一本讲解CPU的流水线设计的教科书,都会提高流水线设计需要解决的三个冒险,分别是
- 结构冒险
- 数据冒险
- 控制冒险
结构冒险
本质上是一个硬件层面的资源竞争问题,也就是一个硬件电路层面的问题。
CPU在同一个时钟周期,同时在运行两条计算机指令的不同阶段,但是这两个不同的阶段,可能会用到同样的硬件电路。
举个例子:
最常见的就是薄膜键盘的锁键问题。常用的最廉价的薄膜键盘,并不是每一个按键的背后都有一根独立的线路,而是多个键公用一个线路。如果我们在同一时间,按下两个公用一个线路的按键,这两个按键的信号就没办法都传输出去。
这也是为什么,重度键盘用户,都要买贵一点的机械键盘或者电容键盘。因为这些键盘每个按键都有独立的传输线路,可以做到“全键无冲”,这样,无论你是要大量写文章、写程序,还是打游戏,都不会遇到按下了键却没生效的情况。
同样的方案,我们一样可以在CPU的结构冒险里面。对于访问内存数据和取指令的冲突,一个直观的解决方案就是把我们的内存分成两部分,让他们各自有各自的地址编译器。
这两部分分别是:
- 存放指令的程序内存
- 存放数据的数据内存
解决方案
由于限制来自于同一个时钟周期不同的指令,要访问相同的硬件资源,解决方案是增加资源。
数据冒险:三种不同的依赖关系
数据冒险,其实就是同时在执行的多个指令之间,有数据依赖的情况。这些数据依赖,我们可以分为三大类,分别是:
- 先写后读
- 先读后写
- 写后再写
// 先写后读
int main() {
int a = 1;
int b = 2;
a = a + 2;
b = a + 3;
}
// 先读后写
int main() {
int a = 1;
int b = 2;
a = b + a;
b = a + b;
}
// 写后再写
int main() {
int a = 1;
a = 2;
}
解决方案
由于限制来自于数据之间的各种依赖,我们提议提前把数据转发到下一个指令。
- 流水线停顿:通过“等待”,也就是插入无效的NOP操作的方式,来解决冒险问题
- 操作数前推: 通过在硬件层面制造一条旁路,让一条指令的计算结果,直接传输给下一条指令,而不再需要“指令1写回寄存器,指令2再读取寄存器”这样多此一举的操作。这样直接传输带来的好处就是,后面的指令可以减少,甚至消除原本需要通过流水线停顿,才能解决的数据冒险问题。
- 乱序执行:在指令执行的阶段通过一个类似线程池的保留站,让系统自己去动态调度先执行哪些指令。这个动态调度巧妙的解决了流水线阻塞的问题。指令执行的先后顺序,不再和他们在程序中的顺序有关。我们只要保证不破坏依赖即可。CPU只要等到在指令结果的最终提交的阶段,在通过重新排序的方式,确保指令“实际上”是最终执行的。
控制冒险
什么是控制冒险?
为了确保能取到正确的指令,而不得不进行等待延迟的情况,就是控制冒险
解决方案:
- 缩短分支延迟
- 分支预测
- 动态分支预测