最近在拜读《Netty、Redis、Zookeeper高并发实战》这本书,想将其内容进行一些记录,就有了这篇文章。
第一章讲述了在这时代高并发的重要性,为什么选用这三个组件,还有本书的实践计划这里就略过了。
第二章是底层理论,IO底层原理,这篇就重点的记录下书中所述的内容。
内存缓冲区与进程缓冲区
1.上层应用使用read系统调用时,仅仅把数据从内核缓冲区复制到上层应用缓冲区(进程缓冲区);
2.上层应用使用write系统调用时,仅仅把数据从应用缓冲区(进程缓冲区)复制到内核缓冲区中;
四种主要的IO模型
1.同步阻塞IO
2.同步非阻塞IO
3.IO多路复用
4.异步IO
简单说一下四种IO
同步阻塞IO:传统的IO模型都是同步阻塞IO。在Java中,默认创建的socket都是阻塞的。
同步非阻塞IO:阻塞是指用户空间(调用线程)一直在等待,而不能干别的事情。非阻塞是指用户空间(调用线程)拿到内核返回的状态值就返回自己的空间,IO操作可以干就干,不可以干,就去干别的事情。非阻塞IO需要将socket设置成NONBLOCK。
其操作可以简单理解成,一个用户发起IO请求,用户线程通知内核,当内核未准备好时立刻返回。用户线程需要不断的发起IO系统调用。当内核数据准备好后,用户线程调用,用户线程阻塞,直到用户线程读到数据才解除阻塞,恢复运行。
IO多路复用:在IO多路复用模型中通过socket/epoll系统调用,单个应用程序的线程,可以不断地轮询成百上千的socket连接,当某个或者某些socket网络连接有IO就绪的状态,就返回对应的可执行的读写操作。
和NIO模型相似,多路复用IO也需要轮询。负责select/epoll状态查询调用的线程,需要不断的进行select/epoll轮询,查找出达到IO操作就绪的socket连接。
Java语言的NIO(New IO)技术,使用的就是IO多路复用模型。在Linux系统上,使用的是epoll系统调用。
异步IO:用户线程通过系统调用,向内核注册某个IO操作。内核在整个IO操作完成后,通知用户程序,用户程序执行后续的操作。
理论上来说,异步IO是真正的异步输入输出,它的吞吐量高于IO多路复用的吞吐量。
异步IO对操作系统有要求,windows已支持,Linux目前并不完善。
而大多数服务器都是Linux操作系统,因而这类高并发应用系统都使用的是IO多路复用模型。
Netty使用的就是IO多路复用模型而不是异步IO。
通过合理配置来支持百万级并发连接
以下皆是Linux操作
普通用户修改/etc/rc.local开机启动文件,在文件中添加如下内容:
ulimit -SHn 1000000
选项-S表示软性极限值;选项-H表示硬性极限值。硬性极限是实际的限制,就是最大100万,不能再多了。软性极限是系统警告,当超过该值系统会发出警告。
如果要更改硬性极限,必须拥有root权限。修改/etc/security/limits.conf来解决,加入如下内容:
soft nofile 1000000
hard nofile 1000000
soft nofile 表示软性极限,hard nofile 表示硬性极限。