前言:
1、什么是IO多路复用:
随着网络需求的增大,对于网络服务性能的要求也越来越高,而这也逐步促进了IO模型的发展。
最初的IO模型是阻塞式的,就是在数据没有准备好的时候,进程处于阻塞状态,屁事不干。
然后程序猿就想:我靠,这小子(暂时叫recvfrom吧)这是占着茅坑不拉屎呀,得让他出去干点其他活。于是就出现了非阻塞式IO。
非阻塞式IO就是在进程之中不断的询问fd,看数据有没有准备好,如果没有准备好,那么先去干其他事,然后过一会再来问数据有没有准备好,这就解决了进程“偷懒”的问题。
但是后来发现那个进程每天累死累活的,也就只能监控一个IO,而且是不管有没有准备好都去访问,大家都知道系统调用很耗时间,这样每次去询问,而且还没有数据的情况下很耗cpu资源。有没有办法让他同时监控多个IO(老板压榨程序猿,程序猿压榨系统),有数据准备好才返回?
于是就请了个职业经理人,当然,这种职业经理人也有三种,分别是select(),poll(),epoll(),请谁好后面再说,请来先让他循环询问是否有IO准备好数据,准备好就立马通知原来的那个recvfrom,让他做相应的处理,没有准备好就进行阻塞。这就是IO的多路复用
IO多路复用好处在于可以不用去创建和维护多个线程/进程,用一个线程/进程来去监控多个IO流,减小了系统的开销
2、select()
select原理:
select会在内核中不断询问数据是否准备好,如果没有准备好的数据,就将进程阻塞,直到有一个或者多个IO数据准备好后,告诉recvfrom,叫他来对数据进行读写。具体过程如下
当我们调用select()时:
1、上下文切换转换为内核态
2、将fd从用户空间复制到内核空间
3、内核遍历所有fd,查看其对应事件是否发生
4、如果没发生,将进程阻塞,当设备驱动产生中断或者timeout时间后,将进程唤醒,再次进行遍历
5、返回遍历后的fd
6、将fd从内核空间复制到用户空间
但是聪明的你一定会发现几个问题:
第一:当那个职业经纪人发现传进来需要监控的文件描述符(下面用fd表示)有数据准备好的,然后就一股脑的把所有fd传回去,完全不告诉你那个fd准备好了,这样我recvfrom又得循环所有fd,查看哪个有数据的,再进行读写。这样的话不仅在复制这个fd的时候会消耗大量cpu,而且重复劳动太多了。这就好像是大学时候的坑爹教授在期末的时候跟我们说:考试的内容都在这本书里面,这本书就是重点,咱绝对不超纲,你们放心。。。。(每次听完都有种想揍人的冲动)
第二:监控的文件描述符数量有限,最大是1024个
3、poll
那么,我们聪明的程序员就想改进下select,那么他们最先改进的就是监控的文件描述符的限制,原来不是说有1024限制吗,那么我现在就把他设计成没有限制,这个时候就出现了poll,poll的基本原理和select差不多,而且poll和select一样有着第一个缺点,就是fd的数组在复制进内核空间和用户空间之间,开销会随着文件描述符的增大而线性增大。
但是缺点要一点一点改,程序猿想出了个终极版本,就是epoll,彻底改进了原来那种低效的无差别轮询,而且不限数量。
4、epoll
epoll和上面两种模型不同的方式在于
1、从用户空间到内核态,数据只拷贝一次:
2、epoll采用基于事件的就绪通知方式,epoll会给当前监控的fd每人发一个回调函数,当有事件发生的时候,内核会采用类似callback的回调机制(有点像事件中断),将文件描述符号放在一个文件描述符表里面,然后每次检测这个表是不是为空,如果不为空就通知recvfrom进行读写数据,为空就阻塞。具体过程如下:
epoll提供了三个函数,epoll_create,epoll_ctl和epoll_wait,epoll_create是创建一个epoll句柄;epoll_ctl是注册要监听的事件类型;epoll_wait则是等待事件的产生
epoll_create 创建一个epoll对象,一般epollfd = epoll_create()
epoll_ctl (epoll_add/epoll_del的合体),往epoll对象中增加/删除某一个流的某一个事件
比如
epoll_ctl(epollfd, EPOLL_CTL_ADD, socket, EPOLLIN);//注册缓冲区非空事件,即有数据流入
epoll_ctl(epollfd, EPOLL_CTL_DEL, socket, EPOLLOUT);//注册缓冲区非满事件,即流可以被写入
epoll_wait(epollfd,...)等待直到注册的事件发生
(注:当对一个非阻塞流的读写发生缓冲区满或缓冲区空,write/read会返回-1,并设置errno=EAGAIN。而epoll只关心缓冲区非满和缓冲区非空事件)。
总结:
(1)select,poll实现需要自己不断轮询所有fd集合,直到设备就绪,期间可能要睡眠和唤醒多次交替。而epoll其实也需要调用epoll_wait不断轮询就绪链表,期间也可能多次睡眠和唤醒交替,但是它是设备就绪时,调用回调函数,把就绪fd放入就绪链表中,并唤醒在epoll_wait中进入睡眠的进程。虽然都要睡眠和交替,但是select和poll在“醒着”的时候要遍历整个fd集合,而epoll在“醒着”的时候只要判断一下就绪链表是否为空就行了,这节省了大量的CPU时间。这就是回调机制带来的性能提升。
(2)select,poll每次调用都要把fd集合从用户态往内核态拷贝一次,并且要把current往设备等待队列中挂一次,而epoll只要一次拷贝,而且把current往等待队列上挂也只挂一次(在epoll_wait的开始,注意这里的等待队列并不是设备等待队列,只是一个epoll内部定义的等待队列)。这也能节省不少的开销。