linux I/O5中模型
引入I/O模型
标准I/O: 缓存 IO 又被称作标准 IO,大多数文件系统的默认 IO 操作都是缓存 IO。在 Linux 的缓存 IO 机制中,操作系统会将 IO 的数据缓存在文件系统的页缓存( page cache )中,也就是说,数据会先被拷贝到操作系统内核的缓冲区中,然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。这杨就会在I/O过程中在两个拷贝数据过程中耗时,耗费内存和cpu。
针对OS的安全性考虑,linux 进程是无法直接操作I/O设备的,必须通过系统调用请求内核来协助完成I/O动作,而内核会为每个I/O设备维护一个buffer。
整个请求过程为: 用户进程发起请求,内核接受到请求后,从I/O设备中获取数据到buffer中,再将buffer中的数据copy到用户进程的地址空间,该用户进程获取到数据后再响应客户端。
linux I/O模型划分
- 系统I/O两个阶段:
first stage:等待数据准备(waiting for the data to be ready)
second stage:将数据从内核拷贝到进程中(copying the data from kernel to process)
- 网络I/O两个阶段:
网络IO的本质是socket的读取,socket在linux系统中被抽象为流,IO可以理解为对流的操作
first stage:通常涉及等待网络上的数据分组到达,然后被复制到内核的某个缓冲区。
second stage:把数据从内核缓冲区复制到应用进程缓冲区。
根据在用户进程进行系统调用等待数据完成和复制数据到用户空间两个阶段的时间,用户进程的行为,对用户进程的等待方式划分为5中模型:
序号 | 模型 | 同步/异步 |
---|---|---|
1 | 阻塞I/O (Blocking I/O) | 同步 |
2 | 非阻塞I/O (Non-Blocking I/O) | 同步 |
3 | I/O复用(I/O Multiplexing) | 同步 |
4 | 信号驱动的I/O (Signal Driven I/O) | 同步 |
5 | 异步I/O (Asynchrnous I/O) | 异步 |
从同步异步,以及阻塞、非阻塞两个维度来划分来看:
blocking | non-bloacking | |
---|---|---|
synchronous | blocking 模型 | non-bloacking 模型 |
Asynchronous | I/O复用模型 | 异步IO模型 |
认识5种模型
阻塞I/O
用户进程 ------------- [系统调用] ------------------->内核
| |等待数据准备(从I/O设备中获得数据)
阻塞 内核(buffer)
| |等待数据复制到用户空间
用户进程<-------------- [返回] -----------------------内核
当用户进程进行系统调用时,内核就开始了I/O的第一个阶段,准备数据到缓冲区中,当数据都准备完成后,则将数据从内核缓冲区中拷贝到用户进程的内存中,这时用户进程才解除block的状态重新运行。所以,Blocking I/O的特点就是在I/O执行的两个阶段都被block了。
非阻塞I/O
用户进程 -------------[系统调用]--------------->内核
-------------------------------------> |
-------------------------------------> | 等待数据准备(从I/O设备中获得数据)
|
| -------------------------------------> 内核(buffer)
阻塞 |
| |等待数据复制到用户空间
用户进程 <--------------[返回]------------------内核
从上图可以看到在I/O执行的两个阶段中,用户进程只有在第二个阶段被阻塞了,而第一个阶段没有阻塞,但是在第一个阶段中,用户进程需要盲等,不停的去轮询内核,看数据是否准备好了,因此该模型是比较消耗CPU的。
I/O复用
用户进程 -------------[系统调用]--------------->内核
| |
|阻塞 |等待数据准备(从I/O设备中获得数据)
<--------------[数据准备完成]----------------(内核)
------------------[系统调用]--------------->(内核)
| |
|阻塞 |等待数据复制到用户空间
用户进程 <--------------[返回]------------------内核
从上图可以看到,I/O执行的两个阶段都是用户进程都是阻塞的,但是两个阶段是独立的,在一次完整的I/O操作中,该用户进程是发起了两次系统调用。
信号驱动的I/O
用户进程 -------------[系统调用]--------------->内核
|
|等待数据准备(从I/O设备中获得数据)
<--------------[主动通知]-------------------(内核)
------------------[系统调用]--------------->(内核)
| |
|阻塞 |等待数据复制到用户空间
用户进程 <--------------[返回]------------------内核
该模型也叫作基于事件驱动的I/O模型,可以看到该模型中,只有在I/O执行的第二阶段阻塞了用户进程,而在第一阶段是没有阻塞的;
区别于非阻塞I/O模型,该模型在I/O执行的第一阶段,当数据准备完成之后,会主动的通知用户进程数据已经准备完成,即对用户进程做一个回调。该通知分为两种,一为水平触发,即如果用户进程不响应则会一直发送通知,二为边缘触发,即只通知一次。
异步I/O
用户进程 -------------[系统调用]--------------->内核
|
|等待数据准备(从I/O设备中获得数据)
|等待数据复制到用户空间
用户进程<-------- [数据完成后通知用户进程] --------内核
当用户进程发起系统调用后,立刻就可以开始去做其它的事情,然后直到I/O执行的两个阶段都完成之后,内核会给用户进程发送通知,告诉用户进程操作已经完成了。
总结一下
阻塞I/O | 非阻塞I/O | I/O复用 | 信号驱动的I/O | 异步I/O | |
---|---|---|---|---|---|
准备数据阶段 | block | check check check ... | block | notification | notifaction |
数据复制阶段 | block | block | block | block | notifaction |