每个CPU有固定的TSS(任务状态段),TSS保存有当前任务的系统堆栈指针SS0和ESP0,切换任务时只是改变SS0和ESP0的值。
进程和线程都有自己独立的系统堆栈和task_struct,如果没有用户空间的线程,为内核线程。线程共享用户空间,进程之间用户空间独立。每个线程的task_struct和系统空间堆栈结构(7KB):
进程fork时,用户空间的拷贝是通过复制页面表暂时共享这个页面,在子进程(或父进程)真的要写这个页面时再来分配页面。(copy on write)
进程退出时,会释放task_struct中的各种资源,但是task_struct和系统空间堆栈所在的两个页面并不会释放。同时进程状态变为TASK_ZOMBIE。之后通过调用exit_notify通知父进程料理后事。
如果父进程先于子进程去世,则会将子进程托付给init进程。
进程的状态:
- TASK_RUNNING: 可以被执行,被放入调度队列
- TASK_INTERRUPTIBLE:睡眠状态,可被中断,一般睡眠是这种
- TASK_UNINTERRUPTIBLE:睡眠装态不可被中断
- TASK_ZOMBIE:进程已去世,但还未被注销
- TASK_STOPPED:调试挂起状态
进程状态转换
task_struct链接入3个队列
-
通过父兄指针
pidhash hash表,每个pid生成一个hash,同一hash的task_struct通过pidhash_next 和pidhash_pprev放入同一个队列
通过next_task 和 prev_task 放入一个系统全局队列
调度
内核态通过schedule(), 用户态通过pause(),引发一次调度(自愿)
linux的调度方式是有条件的可剥夺。当进程在用户空间运行时,一旦有必要(比如运行了足够长的时间),内核可以剥夺其运行而调度其他进程,而当进程进入内核态时就不能进行剥夺了,因为调度都是发生在从用户态进入中断或者异常处理,返回用户态时进行调度(task_struct的need_resched需要设置为true:自愿让出运行,系统调用受阻,时钟中断服务程序发现当前进程运行太久)。
调度政策根据进程的优先级进行调度,运行时间越长优先级越低,当所有进程优先级为0时,重新计算优先级。
被动调度:need_resched被置为1,从内核空间进入用户空间时,会进行调度,这时task状态还为TASK_RUNNING,有可能还会被调度上
- 当前进程的counter减为0时,每次时钟中断会将counter减1
- 唤醒另一个进程,被唤醒进程的优先级更高
- 一个进程通过yield系统调用让路
主动调度:task状态变为TASK_INTERRUPTIBLE或者TASK_UNINTERRUPTIBLE
- read(), write(), open() 这种系统调用受阻而进入睡眠
- nanosleep(),pause() 系统调用
内核中的互斥操作:
- semaphore 信号量(防止死锁的方法:不要在一个临界区进入另一个临界区;进入临界区的顺序一致)
- spin_lock:防止其他处理器中断或进程的干扰,得不到锁的处理器会一直空转