一、相关概念
- 流
可以进行I/O操作的内核对象,如文件、套接字socket、管道pipe
二、同步异步、阻塞非阻塞
同步
发出一个同步功能调用时,在得到结果之前该调用就不返回。也就是必须一件一件事做,等前一件做完了才能做下一件事。
异步
发出一个异步功能调用时,调用者不能立刻得到结果,但仍然返回调用并继续执行其他功能。实际处理这个调用的部件在完成后,通过状态、通知和回调来通知调用者。
阻塞
阻塞调用的结果返回之前,当前线程会被挂起(线程进入非可执行状态,在这个状态下,cpu不会给线程分配时间片,即线程暂停运行)。函数只有在得到结果之后才会返回。
- 阻塞与同步的区别:当前线程是否仍然处于激活状态
【同步】到A楼(内核缓冲区)取快递,但是不知道快递什么时候过来,但又不能干别的事,只能死等着。
【阻塞】但你可以在A楼睡觉(进程处于休眠状态),因为你知道快递把货送来时一定会给你打个电话叫醒你。
非阻塞
非阻塞调用的结果返回之前,当前线程会立刻返回,不会阻塞当前线程。
- 同步和异步的区别
数据访问的时候进程是否阻塞。指当server端的进程需要访问的数据如果尚未就绪,进程是否需要等待。 - 阻塞和非阻塞的区别
应用程序的调用是否立即返回。是client端访问数据的机制。
三、linux下的五种IO模型
前四种属于同步,第五种为异步。
1、阻塞I/O(blocking I/O)
应用程序调用一个IO函数,导致应用程序阻塞,等待数据准备好。
在socket编程中,当调用recv()函数时,系统首先查是否有准备好的数据。如果数据没有准备好,那么系统就处于等待状态。当数据准备好后,将数据从系统缓冲区复制到用户空间,然后该函数返回。
2、非阻塞I/O (nonblocking I/O)
把一个SOCKET接口设置为非阻塞就是告诉内核,当所请求的I/O操作无法完成时,不要将进程睡眠,而是返回一个错误。这样I/O操作函数将不断的测试数据是否已经准备好,如果没有准备好,继续测试,直到数据准备好为止。在这个不断测试的过程中,会大量的占用CPU的时间。
在调用recv()时,如果没有数据也不要让线程睡眠,而应该立即返回,该函数返回一个错误代码。然后继续调用recv()函数,继续返回错误码……直到缓冲区中有数据,recv返回正确码。
3、 I/O复用(select 和poll) (I/O multiplexing)
关键是能实现同时对多个IO端口进行监听。
主要使用了select、poll、epoll三个函数,它们会使进程阻塞,但是和阻塞I/O所不同的是,可以同时阻塞多个I/O操作,而且可以同时对多个读操作、多个写操作的I/O函数进行检测,直到有数据可读或可写时,才真正调用I/O操作函数。
4、信号驱动I/O (signal driven I/O (SIGIO))
首先允许套接口进行信号驱动I/O,并安装一个信号处理函数,进程继续运行并不阻塞。当数据准备好时,进程会收到一个SIGIO信号,可以在信号处理函数中调用I/O操作函数处理数据。
5、异步I/O (asynchronous I/O)
当一个异步过程调用发出后,调用者不能立刻得到结果。实际处理这个调用的部件在完成后,通过状态、通知和回调来通知调用者的输入输出操作
四、IO复用中的select、poll、epoll
select,poll,epoll都是IO多路复用的机制。
I/O多路复用就通过一种机制,可以监视多个描述符,一旦某个描述符就绪(一般是读就绪或者写就绪),能够通知程序进行相应的读写操作。但select,poll,epoll本质上都是同步I/O,因为他们都需要在读写事件就绪后自己负责进行读写,也就是说这个读写过程是阻塞的,而异步I/O则无需自己负责进行读写,异步I/O的实现会负责把数据从内核拷贝到用户空间。
select:O(n)
无差别轮询所有流,找出能读出数据,或者写入数据的流,对他们进行操作。
单个进程可监视的端口fd数量被限制,具体数目可以cat /proc/sys/fs/file-max察看。32位机默认是1024个。64位机默认是2048。
poll:O(n)
本质操作与select无差别,区别是poll基于链表来存储的,无最大连接数的限制。
epoll:O(1)
事件驱动的event poll,不需要无差别轮询,epoll会把哪个流发生了怎样的I/O事件通知我们。
epoll有EPOLLLT和EPOLLET两种触发模式,LT是默认模式,ET是高速模式。
- LT模式(水平触发)
只要这个fd还有数据可读,每次epoll_wait都会返回它的事件,提醒用户程序去操作 -
ET模式(边缘触发)
它只会提示一次,下次再有数据流入前都不会再提示了,无论fd中是否还有数据可读。所以在ET模式下,read一个fd的时候一定要把它的buffer读光,也就是说一直读到read的返回值小于请求值,或者遇到EAGAIN错误。