1.阻塞io,linux下默认所有的io都是阻塞的,
当发起io操作时,程序阻塞,直到io完成才会返回。浪费cpu的资源。
2非阻塞io
当发起io操作后,程序会立即返回,之后程序不断轮询,判断io是否就绪。这种情况下的轮训就是傻轮询,无论io是否就绪,会一直去问。但是好的一点是,在while的轮询过程中可以做一些其它的事情。但是这种非阻塞io往往需要配合多线程达到高效率。因为服务器往往有多个客户端的连接,单一线程要实现对多个连接的管理,往往需要通过队列,对多个socket进行管理,这对用户来说往往很困难(有几个人能手写linux内核对select或epoll的底层实现?),而多线程的切换又是十分消耗系统资源的,所以非阻塞io+多线程实现高性能服务器,往往效果也不是很好。
3.io多路复用(select/epoll)(reactor)
多线程是十分耗费系统资源的,那么我们自然而然就想到能否用单线程实现对多个客户端socket的管理,在上面提到如果在用户态完成这个任务是比较困难的,但是庆幸的是linux内核帮我们实现了这个复杂的操作,典型的两种是select和epoll.二者的区别
select
用一个eventloop队列去管理多个socket,没有io时,select阻塞挂起,但是它只知道有数据到达,并不知道是那个fd(socket)的,所以需要遍历所有的fd,找出真正被触发的socket,执行其对应的处理函数。
epoll
epoll同样维护了一个轮询的eventloop,但是不同的是它在客户端有数据到达时,会被显示的告知是哪几个socket被触发,因此不需要再用o(n)的时间复杂度去轮询,所以性能很高。epoll是单线程异步io,但是这种异步并不是那么纯,因为数据。
4.信号驱动
不常用
5.异步io(被动告知异步)
没有阻塞,就是当数据到达时,利用中断机制切换到用户态处理。io多路复用需要主动轮询,用户自己将数据从内核态地址空间拷贝到用户态,而异步io会将数据的同步自动完成,用户进程只需要去读取数据即可。
异步io和io多路复用区别是异步io是事情做完了你通知我一声,而io多路复用是事情可以做的话你告诉我一声,我去做。
io多路复用会阻塞用户socket,而异步io不会阻塞用户线程。
io多路复用是同步io,因为用户态还要去轮询看看哪些事件可以就绪执行,(虽然操作系统已经触发了对应事件,但是用户还得去轮询队列中一遍遍查看)
异步io(异步非阻塞)用户进程不会被阻塞。
阻塞:调用立即返回
非阻塞:调用不返回
同步: 我自己去问消息是否完成。
异步:主动告知我消息是否完成。