(http://ifeve.com/context-switch-definition/)
多个进程争抢cpu是平均负载升高的原因。
那么,进程在竞争cpu的时候并没有真正的运行,为什么还会导致系统的负载升高呢?原因就是cpu上下文切换
linux是一个多任务的操作系统,支持远大于cpu数量的任务同时运行,这些任务实际上不是真的在同时运行,而是因为系统在很短的时间内将cpu轮流分配给它们,造成多任务同时运行的错觉。
在每个任务运行前,cpu都需要知道任务从哪里加载,又从哪里开始运行,也就是说需要系统实现帮它设置好cpu寄存器和程序计数器。cpu寄存器是cpu内置的极小容量的内存,程序计数器,表示即将执行的下一条指令的位置。
cpu寄存器和程序计数器是cpu在运行任何任务前必须依赖的环境,因此也叫cpu上下文。cpu的上下文切换就是先把前一个任务的cpu上下文保存起来,然后加载新任务的上下文到这些寄存器和程序计数器,最后再跳转到程序计数器所指的新位置,运行新任务
1、引起cpu发生上下文切换的 “任务” 是什么?
根据任务的不同,cpu的上下文切换分为几个不同的场景,也就是:进程上下文切换、线程上下文切换、中断上下文切换
2、系统调用的特权模式切换(也会发生上下文切换)
linux按照特权等级,把进程的运行空间分为内核空间和用户空间。
内核空间具有最高权限,可以直接访问所有资源
用户空间只能访问受限资源,不能直接访问内存等硬件设备,必须通过系统调用陷入到内核中,才能访问这些受限资源。
从用户态到内核态的转变,需要通过系统调用来完成。系统调用的过程中就发生了上下文切换。cpu寄存器里原来用户态的指令位置,需要先保存起来。接着为了执行内核态代码,cpu寄存器更新为内核态指令的新位置。最后跳转到内核态运行内核任务。
一次系统调用的过程其实是发生了两次cpu上下文切换,不过,这个过程只涉及一个进程,而进程上下文切换是从一个进程切换到另一个进程这个过程是特权模式的切换
3、进程上下文切换
进程是由内核来管理和调度的,进程的切换只能发生在内核态。所以,进程的上下文切换不仅包括了虚拟内存,栈,全局变量等用户空间的资源,还包括了内核堆栈,寄存器等内核空间的状态。因此,进程的上下文切换就比系统调用时多一步:在保存当前进程的内核状态和cpu寄存器之前,需要把该进程的虚拟内存栈等保留下来。
保存和恢复上下文需要在内核cpu上运行。
那么,什么时候会切换进程上下文呢?
显然,进程切换的时候才需要切换进程上下文,只有在进程调度的时候,才需要切换进程上下文。
Linux为每个cpu都维护了一个就绪队列,将活跃进程(running 和 runnable) 的进程按照优先级和等待cpu的时间排序,然后选择最需要cpu的进程,也就是优先级最高和等待cpu最长时间的进程来运行。
进程发生调度的场景:
1、进程执行完终止,它之前使用的cpu会被释放出来,这个时候再从就绪队列中拿一个新的进程来运行。
2、为了保证所有进程可以公平调度,cpu时间被划分为一段一段的时间片,这些时间片再被轮流分配给各个进程。这样,当某个进程的时间片耗尽,就会被系统挂起,切换到其他正在等待cpu的进程运行
3、进程在系统资源不足(比如内存不足)时,要等到资源满足才会运行,这个时候进程也会被挂起,并由系统调度其他进程运行
4、当进程通过sleep这样的方法将自己主动挂起时,自然也会重新调度
5、当有优先级更高的进程来运行的时候,为了保证高优先级今晨过的运行,当前进程会被挂起,由高优先级进程运行
6、发生硬件中断时,CPU上的进程会被中断挂起,转而执行内核中的中断服务程序。
4、线程上下文切换
线程和进程最大的区别在于,线程是调度的基本单位,而进程是资源拥有的基本单位。
当进程只有一个线程的时候,可以认为进程就等于线程
当进程拥有多个线程的时候,这些线程会共享相同的虚拟内存和全局变量资源。这些资源在上下文切换的时侯,不需要修改
另外,线程也有自己的私有数据,比如栈和寄存器,这些在上下文切换时需要保存
线程上下文切换的两种情况:
1、前后两个线程属于不同进程,因为此时资源不共享,所以切换过程就跟进程的上下文切换一样
2、前后两个线程属于统一个进程。此时,因为虚拟内存共享,所以在切换的时候,虚拟内存这些资源就保持不动,只需要切换线程的私有数据,寄存器等不共享的数据
注意:虽然同为上下文切换,但是同进程内的线程切换,要比多进程间的切换消耗更少的资源,而着也正是多线程代替多进程的原因
5、中断上下文切换
为了快速响应硬件,中断处理会打断进程的正常调度和执行,转而调用中断处理程序,响应设备事件。
而在打断其他进程时,就需要保存该进程状态,这样在设备事件结束后,就可以从原来的状态恢复。
注意:
与进程上下文不同的是,中断上下文切换不涉及到进程的用户态。所以,即使中断打断了一个正处在用户态的进程,也不需要保存和恢复这个进程的虚拟内存、全局变量等用户资源。中断上下文只包括内核态中断服务程序执行所必须的状态。包括cpu寄存器、内核堆栈、硬件中断参数等。
和进程上下文切换一样的是,中断上下文切换也会消耗cpu。
6、如何查看系统的上下文切换?
vmstat 是一个常用的系统性能分析工具,主要用来分析系统系统内存的使用情况,也常用来分析CPU上下文切换和中断的次数。
[root@server2 ~]# vmstat 5 //每5秒输出一组
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
1 0 0 373804 2108 265772 0 0 19 8 762 1239 16 1 83 0 0
0 0 0 373548 2108 265772 0 0 0 0 103 136 0 0 99 0 0
0 0 0 373556 2108 265772 0 0 0 0 83 120 0 0 100 0 0
cs (context switch) 每秒上下文切换的次数
in (interrupt) 每秒中断的次数
r(running or runnable) 就绪队列的长度,也就是正在运行和等待cpu的进程数
b(Blocked) 处于不可中断睡眠状态的进程数
vmstat 只给出了系统总体的上下文切换情况,要想查看每个进程的详细情况,需要使用pidstat
查看每个进程的详细情况
[root@server2 ~]# pidstat -w 5
Linux 3.10.0-957.el7.x86_64 (server2) 06/11/2019 _x86_64_ (2 CPU)
06:40:37 PM UID PID cswch/s nvcswch/s Command
06:40:42 PM 0 3 0.20 0.00 ksoftirqd/0
06:40:42 PM 0 9 3.19 0.00 rcu_sched
06:40:42 PM 0 11 0.20 0.00 watchdog/0
06:40:42 PM 0 12 0.20 0.00 watchdog/1
06:40:42 PM 0 14 0.40 0.00 ksoftirqd/1
06:40:42 PM 0 37 0.20 0.00 khugepaged
06:40:42 PM 0 3458 19.96 0.00 xfsaild/dm-0
06:40:42 PM 0 3460 0.20 0.00 kworker/0:1H
06:40:42 PM 26 7252 0.40 0.00 postmaster
06:40:42 PM 26 7253 0.20 0.00 postmaster
06:40:42 PM 0 10795 1.00 0.00 kworker/1:1
06:40:42 PM 0 11961 1.20 0.00 kworker/u256:2
06:40:42 PM 0 12053 1.40 0.00 kworker/0:2
06:40:42 PM 0 12277 0.20 0.20 pidstat
cswch 表示内秒自愿上下文切换
自愿上下文切换是指进程无法获取资源导致的上下文切换。比如说I/O、内存等系统资源不足时,就会发生自愿上下文切换
nvcswch 是非自愿上下文切换,是指进程由于事件片已到等原因,被系统强制调度,进而发生的上下文切换,比如大量进程在争抢cpu的时候,就容易发生非自愿上下文切换
7、
环境: 1g内存、centos7、2cpu
安装: yum install sysbench sysstat
在第一个中断里运行sysbench,模拟系统多线程调度的瓶颈:
接着,在第二个中端运行vmstat,观察上下文切换情况
经过几个指标,我们知道,系统的就绪队列过长,也就是正在运行和等待cpu的进程数过多,导致大量的上下文切换,而上下文切换又导致了系统cpu的占用率升高
我们使用pidstat看一下,是哪一个进程导致了这些问题?
所以我们发现,上下文切换导致的cpu使用率升高,是由于sysbench线程的。那么为什么中断次数的指标也剧烈上升
,pidstat只是一个进程性能分析工具,不提供中断的详细信息。
8、每秒多少次上下文切换才算正常?
数值取决于系统cpu性能,还需要根据上下文切换的类型,再做具体分析:
1、自愿上下文切换变多了,说明进程都在等待资源,有可能发生I/O问题
2、非自愿上下文切换变多了,说明进程都在被强制调度,也就是都在争抢cpu,说明cpu的确成为瓶颈
3、中断次数变多,说明cpu被中断程序占用,还需要通过查看/proc/interrupts文件来分析具体的中断类型