一、为什么会有系统调用?
用户进程(如浏览器)免不了要使用系统资源,如打开文件读取内容等操作,但是计算机的资源由操作系统一管理,用户态的进程是不能直接与硬件打交道的,只有操作系统内核(内核态进程)才能与硬件进行交互。
为了解决这个问题,操作系统对硬件资源的操作抽象并封装成相关的接口,供用户进程使用,这些接口就是系统调用,即它是用户进程与内核进行交互的接口。系统调用屏蔽了硬件的复杂性,让程序开发不需要过多地关心硬件的实现。
二、系统调用的机制
系统调用是通过软中断实现的,该中断触发一个异常导致系统切换到内核并执行第128号异常处理程序。不同的中断对对应着不同的处理程序,128号中断的处理程序叫sys_call,即系统调用。
当我们调用系统调用时,例如在代码中使用了系统调用open,该软中断就会产生。但是还是有两个问题没有解决。
1)系统调用接口如此之多,中断处理程序(sys_call)怎么确定要调用的是哪个系统调用呢?
在Linux中,每个系统调用都被赋予一个系统调用号,这个调用号是独一无二的,一旦分配就不能有任何变更,存储在sys_call_table中,即一个系统调用号对应着一个系统调用程序。
系统调用陷入内核的方式都是一样的,不同的系统调用的通过把系统调用号传给内核,让内核知道执行哪个系统调用。在x86上,把系统调用号放在eax寄存器上,内核读取该寄存器的值便知道要调用哪个系统调用了。
2)系统调用是可以传递参数的,这些参数是如何被传递?
系统调用的参数也是通过存放到寄存器上,传到内核空间。在x86-32系统上,ebx、ecx、edx、esi、edi按顺序存放前5个参数,第6个或以上参数用另一个寄存器来存放指向这些参数的用户空间地址的指针,内核通过该指定读取第6个及其后参数。
同时,系统调用的返回值通过寄存器eax存放,并返回到用户态。
三、系统调用的过程
知道了系统调用的机制,系统调用的过程就显而易见了。
首先用户进程调用系统调用,产生系统异常,从用户态陷入到内核态,系统调用往相应的寄存器存入系统调用号、参数等数据,然后触发一个软中断,内核接收到软中断后,根据寄存器的参数,调用相应的系统调用程序,执行用户进程相应的请求。最后返回到用户态
注:内核在执行系统调用时,处于进程上下文,即引发系统调用的那个进程。在进程上下文中,内核可以休眠并且可以被抢占,而新的进程可能会调用同样的系统调用,所以系统调用必须保证是可重入的。