1. 进程的基本概念
首先介绍一个概念叫多道程序设计(multiprogramming)。所谓多道程序设计是指允许多个程序同时进入内存并运行,其目的是为了提高系统效率。在操作系统中,满足多道程序设计,这样导致了操作系统是一个并发的环境,即一段时间间隔内,单处理器上有两个或两个以上的程序同时处于开始运行但尚未结束的状态,并且次序不是事先确定的。
为了实现操作系统的并发性,进程(Process)的概念产生了。进程是具有独立功能的程序关于某个数据集合上的
一次运行活动,是系统进行资源分配和调度的独立单位。进程是程序的一次执行过程,是正在运行程序的抽象,
系统资源以进程为单位分配,如内存、文件、......每个进程具有独立的地址空间,操作系统将CPU调度给需要的进程。
2. 进程控制块
操作系统中管理进程的数据结构叫做进程控制块(PCB),它记录了进程的各种属性,描述进程的动态变化过程。进程与PCB是一一对应的。所有的PCB集合称作进程表。
PCB的内容包含:
- 进程描述信息
- 进程标识符,唯一,通常是一个整数
- 进程名,通常基于可执行文件名,不唯一
- 用户标识符
- 进程组关系
- 进程控制信息
- 当前状态
- 优先级(priority)
- 代码执行入口地址
- 程序的磁盘地址
- 运行统计信息(执行时间、页面调度) 进程间同步和通信
- 进程的队列指针
- 进程的消息队列指针
- 进程所拥有的资源和使用情况
- 虚拟地址空间的状况
- 打开文件列表
- CPU的现场信息
- 寄存器值(通用寄存器、程序计数 器PC、程序状态字PSW、栈指针)
- 指向该进程页表的指针
3. 进程状态及其转换
进程有三种基本状态:运行态、就绪态、等待态。这三者的定义是:
- 运行态(Running) 占有CPU,并在CPU上运行
- 就绪态(Ready) 已经具备运行条件,但由于没有空闲CPU,而暂时不能运行
- 等待态(Waiting/Blocked) 因等待某一事件而暂时不能运行
三状态模型及状态转换:
进程的其他状态
- 创建(new)
- 已完成创建一进程所必要的工作 – PID、PCB
- 但尚未同意执行该进程 – 因为资源有限
- 终止(terminated)
- 终止执行后,进程进入该状态
- 可完成一些数据统计工作
- 资源回收
- 挂起(suspend)
- 用于调节负载
- 进程不占用内存空间,其进程映像交换到磁盘上
五状态进程模型:
七状态进程模型:
进程队列:
- 操作系统为每一类进程建立一个或多个队列
- 队列元素为PCB
- 伴随进程状态的改变,其PCB从一个队列进入另一个队列
五状态模型的队列模型:
4. 进程的控制
进程控制操作完成进程各状态之间的转换,由具有特定功能的原语完成
- 进程创建原语
- 进程撤消原语
- 阻塞原语
- 唤醒原语
- 挂起原语
- 激活原语
- 改变进程优先级 ......
原语(primitive):完成某种特定功能的一段程序,具有不可分割性或不可中断性即原语的执行必须是连续的在执行过程中不允许被中断。
进程的创建:
- 给新进程分配一个唯一标识以及进程控制块
- 为进程分配地址空间
- 初始化进程控制块
- 设置默认值 (如: 状态为 New,...) 设置相应的队列指针。如: 把新进程加到就绪队列链表中
进程的撤销:
- 收回进程所占有的资源
- 关闭打开的文件、断开网络连接、回收分配的内存、......
- 撤消该进程的PCB
进程阻塞
处于运行状态的进程,在其运行过程中期待某一事件发生,如等待键盘输入、等待磁盘数据传输完成、等待其它进程发送消息,当被等待的事件未发生时,由进程自己执行 阻塞原语,使自己由运行态变为阻塞态
Unix 进程控制操作:
- fork() 通过复制调用进程来建立新的进程,是最基本的进程建立过程
- exec() 包括一系列系统调用,它们都是通过用一段新的程序代码覆盖原来的地址空间,实现进程执行代码的转换
- wait() 提供初级进程同步操作,能使一个进程等待另外一个进程的结束
- exit() 用来终止一个进程的运行
进程的分类方法有多种, 例如:
- 系统进程,用户进程
- 前台进程,后台进程
- CPU密集型进程,I/O密集型进程
进程与程序的区别:
- 进程更能准确刻画并发,而程序不能
- 程序是静态的,进程是动态的
- 进程有生命周期的,有诞生有消亡,是短暂的;而程序是相对长久的一个程序可对应多个进程
- 进程具有创建其他进程的功能
进程的地址空间:
进程映像(IMAGE)
对进程执行活动全过程的静态描述,由进程地址空间内容、硬件寄存器内容及与该进程相关的内核数据结构、内核栈组成
- 用户相关:进程地址空间(包括代码段、数据段、 堆和栈、共享库......
- 寄存器相关:程序计数器、指令寄存器、程序状态 寄存器、栈指针、通用寄存器等的值
- 内核相关:
- 静态部分:PCB及各种资源数据结构
- 动态部分:内核栈(不同进程在进入内核后使用不同的内核栈)
上下文(Context)切换
- 将CPU硬件状态从一个进程换到另一个进程的过程称 为上下文切换
- 进程运行时,其硬件状态保存在CPU上的寄存器中寄存器:程序计数器、程序状态寄存器、栈指针、通用寄存器、其他控制寄存器的值
- 进程不运行时,这些寄存器的值保存在进程控制块PCB中;当操作系统要运行一个新的进程时,将PCB中的相关值送到对应的寄存器中
5. 线程的基本概念:
进程中的一个运行实体,是CPU的调度单位。有时将线程称为轻量级进程。
线程的属性:
- 有标示符ID
- 有状态及状态转换 → 需要提供一些操作
- 不运行时需要保存的上下文
有上下文环境:程序计数器等寄存器 - 有自己的栈和栈指针
- 共享所在进程的地址空间和其他资源
- 可以创建、撤消另一个线程
程序开始是以一个单线程进程方式运行的
线程机制的实现
- 用户级线程:
- 在用户空间建立线程库: 提供一组管理线程的过程
- 运行时系统:完成线程的管理工作(操作、线 程表)
- 内核管理的还是进程,不知道线程的存在
- 线程切换不需要内核态特权
-
例子:Unix
用户级线程优缺点:
优点:
- 线程切换快
- 调度算法是应用程序特定的
- 用户级线程可运行在任何操作系统上(只需要实现线程库)
缺点:
- 内核只将处理器分配给进程,同一进程中的两 个线程不能同时运行于两个处理器上
- 大多数系统调用是阻塞的,因此,由于内核阻 塞进程,故进程中所有线程也被阻塞
- 核心级线程
- 内核管理所有线程管理,并向应用程序提供API接口
- 内核维护进程和线程的上下文
- 线程的切换需要内核支持
-
例子:Windows
- 混合模型:
- 线程创建在用户空间完成
- 线程调度等在核心态完成
- 例子:Solaris