IO多路复合之select，poll，epoll

前言：

1、什么是IO多路复用：

随着网络需求的增大，对于网络服务性能的要求也越来越高，而这也逐步促进了IO模型的发展。

最初的IO模型是阻塞式的，就是在数据没有准备好的时候，进程处于阻塞状态，屁事不干。

然后程序猿就想：我靠，这小子（暂时叫recvfrom吧）这是占着茅坑不拉屎呀，得让他出去干点其他活。于是就出现了非阻塞式IO。

非阻塞式IO就是在进程之中不断的询问fd，看数据有没有准备好，如果没有准备好，那么先去干其他事，然后过一会再来问数据有没有准备好，这就解决了进程“偷懒”的问题。

但是后来发现那个进程每天累死累活的，也就只能监控一个IO，而且是不管有没有准备好都去访问，大家都知道系统调用很耗时间，这样每次去询问，而且还没有数据的情况下很耗cpu资源。有没有办法让他同时监控多个IO（老板压榨程序猿，程序猿压榨系统），有数据准备好才返回？

于是就请了个职业经理人,当然，这种职业经理人也有三种，分别是select()，poll()，epoll()，请谁好后面再说，请来先让他循环询问是否有IO准备好数据，准备好就立马通知原来的那个recvfrom，让他做相应的处理，没有准备好就进行阻塞。这就是IO的多路复用

IO多路复用好处在于可以不用去创建和维护多个线程/进程，用一个线程/进程来去监控多个IO流，减小了系统的开销

2、select()

select原理：

select会在内核中不断询问数据是否准备好，如果没有准备好的数据，就将进程阻塞，直到有一个或者多个IO数据准备好后，告诉recvfrom，叫他来对数据进行读写。具体过程如下

image.png

当我们调用select()时：

1、上下文切换转换为内核态

2、将fd从用户空间复制到内核空间

3、内核遍历所有fd，查看其对应事件是否发生

4、如果没发生，将进程阻塞，当设备驱动产生中断或者timeout时间后，将进程唤醒，再次进行遍历

5、返回遍历后的fd

6、将fd从内核空间复制到用户空间

但是聪明的你一定会发现几个问题：

第一：当那个职业经纪人发现传进来需要监控的文件描述符（下面用fd表示）有数据准备好的，然后就一股脑的把所有fd传回去，完全不告诉你那个fd准备好了，这样我recvfrom又得循环所有fd，查看哪个有数据的，再进行读写。这样的话不仅在复制这个fd的时候会消耗大量cpu，而且重复劳动太多了。这就好像是大学时候的坑爹教授在期末的时候跟我们说：考试的内容都在这本书里面，这本书就是重点，咱绝对不超纲，你们放心。。。。（每次听完都有种想揍人的冲动）

第二：监控的文件描述符数量有限，最大是1024个

3、poll

那么，我们聪明的程序员就想改进下select，那么他们最先改进的就是监控的文件描述符的限制，原来不是说有1024限制吗，那么我现在就把他设计成没有限制，这个时候就出现了poll，poll的基本原理和select差不多，而且poll和select一样有着第一个缺点，就是fd的数组在复制进内核空间和用户空间之间，开销会随着文件描述符的增大而线性增大。

但是缺点要一点一点改，程序猿想出了个终极版本，就是epoll，彻底改进了原来那种低效的无差别轮询，而且不限数量。

4、epoll

epoll和上面两种模型不同的方式在于

1、从用户空间到内核态，数据只拷贝一次：

2、epoll采用基于事件的就绪通知方式，epoll会给当前监控的fd每人发一个回调函数，当有事件发生的时候，内核会采用类似callback的回调机制（有点像事件中断），将文件描述符号放在一个文件描述符表里面，然后每次检测这个表是不是为空，如果不为空就通知recvfrom进行读写数据，为空就阻塞。具体过程如下：

epoll提供了三个函数，epoll_create,epoll_ctl和epoll_wait，epoll_create是创建一个epoll句柄；epoll_ctl是注册要监听的事件类型；epoll_wait则是等待事件的产生

epoll_create 创建一个epoll对象，一般epollfd = epoll_create()

epoll_ctl （epoll_add/epoll_del的合体），往epoll对象中增加/删除某一个流的某一个事件

比如

epoll_ctl(epollfd, EPOLL_CTL_ADD, socket, EPOLLIN);//注册缓冲区非空事件，即有数据流入

epoll_ctl(epollfd, EPOLL_CTL_DEL, socket, EPOLLOUT);//注册缓冲区非满事件，即流可以被写入

epoll_wait(epollfd,...)等待直到注册的事件发生

（注：当对一个非阻塞流的读写发生缓冲区满或缓冲区空，write/read会返回-1，并设置errno=EAGAIN。而epoll只关心缓冲区非满和缓冲区非空事件）。

总结：

（1）select，poll实现需要自己不断轮询所有fd集合，直到设备就绪，期间可能要睡眠和唤醒多次交替。而epoll其实也需要调用epoll_wait不断轮询就绪链表，期间也可能多次睡眠和唤醒交替，但是它是设备就绪时，调用回调函数，把就绪fd放入就绪链表中，并唤醒在epoll_wait中进入睡眠的进程。虽然都要睡眠和交替，但是select和poll在“醒着”的时候要遍历整个fd集合，而epoll在“醒着”的时候只要判断一下就绪链表是否为空就行了，这节省了大量的CPU时间。这就是回调机制带来的性能提升。

（2）select，poll每次调用都要把fd集合从用户态往内核态拷贝一次，并且要把current往设备等待队列中挂一次，而epoll只要一次拷贝，而且把current往等待队列上挂也只挂一次（在epoll_wait的开始，注意这里的等待队列并不是设备等待队列，只是一个epoll内部定义的等待队列）。这也能节省不少的开销。