https://www.jianshu.com/p/ef418ccf2f7d
本文是对大宽宽文章的总结
BIO的确定是Block
block:
用系统的read从scoket获取一段数据
用系统的read从一个磁盘读取一段数据到内存
对于linux 第一种算是block,因为其无法知道网络上对方是否会发数据,如果没有数据只能等
第二种对于磁盘IO不算做block
所谓“Block”是指操作系统可以预见这个Block会发生才会主动Block。例如当读取TCP连接的数据时,如果发现Socket buffer里没有数据就可以确定定对方还没有发过来,于是Block;而对于普通磁盘文件的读写,也许磁盘运作期间会抖动,会短暂暂停,但是操作系统无法预见这种情况,只能视作不会Block,照样执行。
作者:大宽宽
链接:https://www.jianshu.com/p/ef418ccf2f7d
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。
基于上述我们讨论io都是网络io而非磁盘Io,Nio和多路复用器只对网络io有意义
严格的说,O_NONBLOCK和IO多路复用,对标准输入输出描述符、管道和FIFO也都是有效的。但本文侧重于讨论高性能网络服务器下各种IO的含义和关系,所以本文做了简化,只提及网络IO和磁盘文件IO两种情况。
BIO:
如果read时候没有数据,就会block
BIO缺点:
支持的并发低,因为会阻塞导致很多线程浪费
NIO:
read的时候如果没有数据直接返回
NIO缺点:
如果有大量的fd 需要一个个调用read,这就导致需要很多线程
需要配合轮训,轮训的时间不好设定
IO多路复用:
程序注册一组socket文件描述符给操作系统,标识我要监视这些fd是否有io事件发生,有就告诉程序处理
NIO只是确保read不会被block,Io多路复用激进操作系统提供的一种便利的通知机制
多路复用需要配置NIO,虽然io也可以但是没有效果
IO多路复用的误区:
多个数据流共享一个socket,这是错误的(netty中的channel可以看成是和socket一一对应的关系(但不相等)他们注册在selector)
多个数据流共享同一个TCP连接的场景的确是有,比如Http2 Multiplexing就是指Http2通讯中中多个逻辑的数据流共享同一个TCP连接。但这与IO多路复用是完全不同的问题。
IO多路复用并没有减少IO,只是解决了调度问题,不需要每次在用户态把fd传递到内核态 去查看事件是否准备好
多路复用底层实现方式
select
其参数接受三个文件描述符的数组 分别代表读取 写入 和异常
每次select都需要把描述符复制到内核态
且每次若有一个描述符有时间到了就返回,那么下次还需要重新来,效率较低
每次还需要挨个遍历是谁有事件发生了
大的fd数组的长度是1024
其实无状态的每次都需要重新传递fd
poll:
没有数组长度限制
其与select 类似 只是 数组由三个变为一个
epoll:
epoll_create首先在内核创建一个数据表(mmap)返回一个指向epoll的文件描述符指向该表,该表会随着事件注册和注销动态变化
创建表的意义:epoll是有状态,不需要每次都重新传入要监听的fd,避免状态切换和数据复制
epoll数据描述符被进程fork,子进程是可以继续的
epoll_ctl是注册要监听的事件
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
其中第一个参数就是上面创建的epfd。第二个参数op表示如何对文件名进行操作,共有
EPOLL_CTL_ADD - 注册一个事件
EPOLL_CTL_DEL - 取消一个事件的注册
EPOLL_CTL_MOD - 修改一个事件的注册
第三个参数是要操作的fd,这里必须是支持NIO的fd(比如socket)
第四个参数是一个epoll_event的类型的数据,表达了注册的事件的具体信息。
通过epoll_ctl就可以灵活的注册/取消注册/修改注册某个fd的某些事件。
使用epoll_wait来等待事件的发生。
int epoll_wait(int epfd, struct epoll_event *evlist, int maxevents, int timeout);
特别留意,这一步是"block"的。只有当注册的事件至少有一个发生,或者timeout达到时,该调用才会返回。这与select和poll几乎一致。但不一样的地方是evlist,它是epoll_wait的返回数组,里面只包含那些被触发的事件对应的fd,而不是像select和poll那样返回所有注册的fd。
epoll的优势:
不需要每次查询把fd由用户复制到内核,并且获取到可执行的事件还需要遍历
假设发生事件的fd的数量接近所有注册事件fd的数量,那么epoll的优势就没有了,其性能表现会和poll和select差不多。
水平触发
当返回的fd中的数据没有被处理完,重新注册该fd的时候,其还会发生,因为还留有上一次的遗留数据
边沿触发
当返回的数据没有被处理完成,重新注册该fd,该fd不会有事件除非这个时候有新的数据到了
默认是水平触发
边沿触发的性能更好