每个进程都可以通过系统调用fork来创建子进程,子进程复制父进程的数据段、堆、栈和代码段。全盘复制父进程的数据会很低效,Linux内核采用一种写时复制(Cpoy On Write)的机制来提高创建进程的效率。
子进程也可以通过系统调用exec来加载一个新程序,覆盖原先从父进程复制的数据段、代码段、堆和栈等。
进程的属性
进程描述符保存了进程相关的属性,包括优先级、状态、虚拟地址范围以及各种访问权限。进程描述符其实就是一种数据结构,在Linux系统中,每个进程都有一个唯一标识(也会保存在进程描述符中),就是进程ID,即PID,还有父进程ID,即PPID。
进程状态
进程的空间
用户进程存在于用户空间中,无法与硬件进行交互;内核进程存在于内核空间中,可以直接与硬件交互;
用户空间和内核空间都是操作系统对内存范围的划分,这里说的内存其实是虚拟内存,并不等同于物理内存。
用户进程只能通过内核提供的系统调用,来操作内核,达到和硬件交互的效果。
系统调用使用上跟普通的函数调用是一样的,但其实是两种东西,CPU在执行进程的时候,会有状态的概念-内核态和用户态,比如在执行用户进程的时候,CPU是没有权限访问内核空间的。因此,在进行系统调用的时候,还伴随着CPU状态的变换。
进程切换意味着需要做上下文的切换(其实就是CPU运行过程中寄存器状态的保存和切换),线程切换也会有这部分开销。
IPC-进程间通信
上述描述的是多进程不断的切换,获得CPU调度,相互独立的执行。
但其实大多数常见,都是需要多进程协同完成某些任务的,这就需要IPC的支持。
资源共享
多进程(或者是多线程、多协程等)访问统一资源,难免会相互干扰,这个干扰就成为竞态条件。
资源共享还引入了两个概念:
- 原子操作:执行过程中不能被中断的操作成为原子操作。
- 临界区:需要串行访问的资源或者代码段,成为临界区。
管道
管道是一种单向的通信方式。
信号
一种异步的通信方式,用软件来模拟硬件的中断机制,通知某个进程某个事件发生了。每个信号都是以“SIG”前缀的名字,本质上其实是正整数。
Linux支持62种信号,分为标准信号(131)和实时信号(3464)。
- 标准信号:同一个进程,每种标准信号只会被记录和处理一次。
- 实时信号:多个同种类的信号都可以被记录,并且按顺序被处理。
socket
实现分布式通信