一、计算机的组成及学习大纲
1. 计算机的组成
计算机的三大件 :CPU、内存、主板
(1)CPU,中央处理器,计算机最核心的配件,负责所有的计算。
(2)内存,你编写的程序、运行的游戏、打开的浏览器都要加载到内存中才能运行,程序读取的数据、计算的结果也都在内存中,内存的大小决定了你能加载的东西的多少。
(3)主板,存放在内存中数据需要被CPU读取,CPU计算完成后,还要把数据写入到内存中,然而CPU不能直接插在内存上,这就需要主板出马了,主板上很多个插槽,CPU和内存都是插在主板上,主板的芯片组和总线解决了CPU和内存之间的通讯问题,芯片组控制数据传输的流转,决定数据从哪里流向哪里,总线是实际数据传输的告诉公里,总线速度决定了数据的传输速度。
(4)输入/输出设备,其实有了以上三大件之后,计算机就可以跑起来了。我们日常使用的话还需要键盘、鼠标、显示器等输入/输出设备,而很多云服务器通过SSH远程登录就可以访问,就不需要配显示器、鼠标、键盘这些东西,节省成本且方便维护。
(5)硬盘,有了硬盘数据才能长久的保存下来,大部分还会给自己的机器配上机箱和风扇,解决灰尘和散热问题,不过这些也不是必须的,用纸板和电风扇替代也一样可以用。
(6)显卡,显卡里有GPU图形处理器,主要负责图形渲染,使用图形界面操作系统的计算机,显卡是必不可少的。现在的主板都带了内置的显卡,如果想玩游戏、做图形渲染,一般需要一张单独的显卡,插在主板上。
2. 冯·诺依曼体系
现代计算机的硬件基础架构都是依赖于冯诺依曼提出的冯诺依曼体系结构,现代计算机的核心架构可以抽象为五个基础组件:运算器、控制器、存储器、输入设备和输出设备。
具体到现代计算机,运算器和控制器组成了现代计算机的CPU,存储器对应着内存和硬盘,主板控制着CPU、内存、硬盘、输出/输出设备之间的通讯。
冯诺依曼体系结构也叫做存储程序计算机,即可编程、可存储的计算机。
任何一台计算机的任何一个部件都可以归到运算器、控制器、存储器、输入设备和输出设备中,而所有的现代计算机也都是基于这个基础架构来设计开发的。
冯诺依曼体系结构确立了我们现代计算机的硬件基础架构,学习计算机组成原理,就是学习和拆解冯诺依曼体系。
学习组成原理,就是学习以下内容:
CPU(运算器+控制器)怎么工作,为什么这么设计;
内存和硬盘的工作原理;
CPU是怎么和内存、硬盘、输入设备、输出设备通讯的;
从电路这样的硬件到最终开发给软件的接口是怎么运作的,为什么要这么设计,以及在软件开发层面怎么尽可能的用好它;
3. 计算机组成原理学习大纲
学习大纲:
计算机的基本组成:冯诺依曼体系结构的五大基本组件:运算器、控制器、存储器、输入设备和输出设备;计算机的两个核心指标:性能和功耗。
计算机的指令和计算:高级语言是怎么跑起来的,怎么通过编译器和汇编器变成机器指令的;操作系统怎么链接、装载、执行程序的;指令的执行是怎么控制的(控制器)。
运算器,数据在计算机中的表示(二进制和编码);计算机是怎么实现加法、乘法等基本运算功能的。
CPU的设计:我们为什么需要CPU时钟;寄存器和内存怎么组成的;整个计算机的数据通路是如何构造的;CPU的流水线设计;数据和控制冒险;分支预测;CPU的异常和中断机制;指令的并行执行;CPU怎么通过SIMD来支持并行计算。
存储器的原理:CPU高速缓存、内存、SSD硬盘和机械硬盘的工作原理,及它们之间的性能差异;CPU和存储器之间怎么通讯的;什么是IO_WAIT;如何通过DMA提升程序性能;如何保证存储器里的数据不丢失;如何通过RAID、Erasure Code、ECC、HDFS,这些不同的技术来确保数据的完整性和访问性能。
总结:计算机组成原理是整个计算机科学的纲要,这门课程的很多知识点深挖下去都会变成一个核心课程。
例如:
计算是怎么实现的,对应着数字电路课程。
CPU和存储器系统的优化,对应着计算机体系结构课程。
程序通过编译器和汇编器变成机器指令的编译过程,对应着编译原理课程。
操作系统是怎么链接、装载、执行程序的,对应着操作系统课程。
二、下面我们根据课程大纲,大致过一遍组成原理
1. 性能
衡量计算机的性能,主要有两个指标:响应时间和吞吐率。
响应时间,就是执行一个程序花费的时间,花的时间越短,性能就越好。
吞吐率,就是一定时间内,到底能处理多少数据和指令,处理的越多,性能就越好。
我们一般把性能定义为响应时间的倒数,也就是:性能 = 1 / 响应时间
响应时间也就是CPU执行我们程序的时间,我们对时间这个指标进行拆解,把程序的CPU执行时间变成CPU时钟周期数和时钟周期时间的乘积。
程序的CPU执行时间 = CPU时钟周期数 x 时钟周期时间
程序的CPU执行时间 = 指令数 x 每条指令的平均时钟周期数 x 时钟周期时间
所以优化性能,就要从这三者入手了:
指令数,代表执行我们的程序到底需要多少条指令,一般都是编译器去做。
每条指令的平均时钟周期数,就是执行一条指令需要的CPU周期数。
时钟周期时间,也就是计算机主频,摩尔定律就在提高我们计算机的主频,例如:主频为2.8GHz,简单理解就是1秒钟可以执行2.8G条指令。
2. 功耗
从上面可以看出,想要提升性能,可以通过减少响应时间的方法来提升,减少响应时间又有三条路可以走:减少指令数、减少周期数、提升主频。
过去相当长的时间里,工程师们都在目光集中在提升计算机主频,在CPU中增加晶体管密度,提升晶体管“打开”和“关闭”的速度,这两者都会带来耗电和散热的问题。
CPU的功耗 = 1/2 x 负载电容 x 电压的平方 x 开关频率 x 晶体管数量
为了平衡性能和功耗,工程师们想尽办法把晶体管的制程从28nm缩小到7nm,让CPU中可以更多晶体管,同时呢又降低电压,这让我们的CPU性能也一直提升。
但是,这种做法终有极限,所以工程师们又开始通过提升吞吐率来提升性能,而不是响应时间,所以我们现在的CPU慢慢的由单核发展成了2核、4核、8核的CPU,让更多的核心同时工作,通过并行来提升性能。
总结
无论是通过提升主频,还是增加更多的CPU核心数量并行处理,都有其瓶颈所在,仅仅通过“堆硬件“的方式,今天已经不能很好的满足我们对于性能的期望了,这就需要我们从其他方面入手了:
加速大概率事件
通过流水线提升性能,把CPU指令执行进行合理的拆分、细化。
通过预测提升性能,提前预测下一步做什么,提前进行响应的操作。
3. 计算机指令
从软件层面看,CPU就是一个执行各种计算机指令的机器,计算机指令就是指计算机能听懂的语言,我们把它叫做机器语言。
不同的CPU由于架构不同,能听懂的语言也不同,也拥有不同的计算机指令集。
也就是说,CPU不同->指令集不同->机器语言不同->汇编语言不同
那么,我们平常用的高级语言是怎么变成机器语言的呢?
高级语言,需要编译成汇编语言,然后通过汇编器翻译成机器代码,才能让CPU去执行。