当我们使用像 nproc或者 lscpu等命令 来在CPU级别上获取计算机的架构和性能的时候,我们常常会发现我们不能够正确的解释这些命令的结果,原因在于我们搞不清楚一些术语的含义,例如: 物理CPU (physical CPU)、 逻辑CPU(logical CPU)、虚拟CPU(virtual CPU)、核数(core)、线程数(thread)、颗数(socket)等。如果再加上 超线程(不要与多线程搞混了)的概念,我们就完全搞不清楚我们的机器是多少核(Core)的了,比如说,我们明明购买的是一个配置为 4核处理器的机器,使用htop命令的结果却显示我们有8个cpu。总而言之,真是一团乱麻 o(╯□╰)o。
为了阐述清楚这些问题,我将使用一组简单的图表,希望能够让你容易地明白上面这些概念,从此不再困惑。
起步:单核CPU ( single core CPUs )和超线程(HyperThreading)
让我们回到奔腾(Pentium)处理器的年代,那时候诸如 多核(multi-core)、虚拟CPU(virtual CPU)、逻辑CPU(virtual CPU)的概念还不存在,绝大多数的计算机在它们的主板上仅仅安装 单独的一块大容量芯片,我们称之为 微处理器、处理器或者 简单的CPU(microprocessor, processor or simply CPU)。只有少数的一些企业级计算机或者是大型的服务器因为对更大处理性能的需要才会在同一块主板上存在两块或更多的CPU芯片:我们把这样的机器称作是多处理器系统(multiprocessor systems)。这些芯片与主板上的其他组件通过一个连接器(connector)或者 插槽(socket)通信。 这样的话计算cpu的个数就很简单了: 主板上存在多少个这样的连接器(connector)或 插槽(socket),那么这台计算机就有多少个cpu。如果希望获得更强大的处理性能,一是在主板上安装更多的cpu,二是提高每一个cpu自身的处理能力。
但是后来Intel意识到 在一台多处理器的机器上不同处理器之间的通信非常的低效,因为这样的通信必须经过系统总线(the system bus),而系统总线通常速度都很慢。这样就常常会造成性能瓶颈,无法充分利用每一个CPU提供的计算能力。
为了应对上面提到的问题,发明了超线程技术(HyperThreading), 超线程的原理是在同一个cpu芯片内部有些内部组件会存在多份,比如 寄存器或者一级缓存,这样同一个cpu就可以用来执行多个线程或者进程,并且它们之间的通信是在cpu内部,不会造成因为要经由系统总线通信而造成的性能瓶颈。如果一个进程因为等待一个中断而阻塞,那另一个进程就可以继续使用这个cpu来计算(注: 所以实际上超线程并不能真正意义上实现并行)。
这种方式的确可能加速多个计算进程,并提供比传统的处理器更为强大的整体性能。某种程度上来说,此时的操作系统是被欺骗了的,因为超线程实际上仅仅提供了两个虚拟或者逻辑CPU(LCPU)就让操作系统可以"同时"执行两个进程了(注:注意 同时 加了引号)。需要重点指出的是: 使用超线程技术的处理器 是无法提供一个传统处理器两倍的计算能力的,也不能够实现真正意义上的并行计算。(注: 这就是前面 同时 加了引号的原因)
因此,从Linux或者其他操作系统的角度来看:一个单核处理器却展现出拥有两个处理器的能力。 只不过这两个逻辑cpu运行在同一个物理cpu内部而已。
下面这张图说明了 超线程的实现原理:
注: 说一些对这张图的理解,在一个物理cpu内部,存在两组 寄存器,分别属于一个 逻辑CPU, 但是只存在一组ALU(算数逻辑单元),如果每一个逻辑cpu上运行一个进程,那么这两个进程间的通信就完全在CPU内部,无需通过系统总线,但是 从唯一的ALU上我们也能看出来 实际上是无法真正意义上同时执行两个进程的。
进一步改进:多核架构的出现(multi-core architectures)
就像前面说的那样,尽管超线程技术提供了更强的处理性能,但是终究无法像两个独立的物理处理器那样。所以进一步的改进是 将所有处理器组件做的更小,实现在同一个芯片上可以同时存在多个处理器。在同一个芯片上的每一个处理器我们称之为 核(Core),同一个芯片上的多个核也无需通过慢速的系统总线通信,因为在这个芯片内部存在内部总线。
注: 我们常说的几颗几核的含义: Core(核) 代表一个独立的Cpu, Socket(颗) 本意是插槽, 代表一个主板上的芯片,多核架构就是在一个芯片上放多个处理器,就像上面说的那样, 所以如果我们说 2颗4核, 代表主板上有2个芯片插槽,每个芯片上存在4个cpu,所以我们有8个物理cpu,如果存在超线程,我们还可能多出8个逻辑cpu,总共16个逻辑cpu
下面这张图展示了一个 四核CPU,并且使用了超线程技术,我们可以看到这四个核都存在于同一个芯片上(CPU chip),它们通过内部的BUS INTERFACE通信。
与超线程技术不同,现在我们完全拥有了成倍的处理能力。而且从性能上来说, 一个一颗四核的处理器要更优于四个一颗一核(也就是传统的单核CPU)的处理器。
在操作系统层面上来看,一个物理的四核处理器将被看做四个独立的处理器。如果提供了超线程,那么可能会再多出4个逻辑处理器(LCPU),这样的话我们通过命令行查看的话就会显示出有8个cpu,但是就像我们前面已经指出的那样,因为超线程才拥有的这8个cpu肯定比不上 一个没有超线程的物理的8核处理器。
1 LCPU = 1 thread
有时候我们会发现处理器标称每核有4线程,2线程或类似的说法,简单来说这就是指每核cpu上能够“同时”运行的线程或进程数(注意同时依旧加了引号),基本上就是一个逻辑cpu(LCPU)能运行一个进程或线程。如果每核能执行2个或更多的线程,那么一定使用了超线程技术,否则每一核就只能运行一个线程或进程。
Logical CPU vs Virtual CPU
虚拟CPU基本等同于逻辑CPU,但是存在一点不同:虚拟CPU更多的是限定在 计算虚机化的语境内。虚拟CPU映射到 虚拟化底层的宿主机硬件资源,通常来说,一个宿主机上的逻辑cpu就映射为一个虚拟机内部的虚拟CPU,所以他们基本上是同一个术语。
注:
最后附上我的一台环境的cpu信息,这是一个运行虚拟机的宿主机,我们看到它有40个逻辑cpu, 我在虚拟化管理台上给一个虚拟机分配40个cpu的时候会报错,39个就能成功创建,某种程度上证明了上面关于虚拟cpu的说法: