网络编程模型闲谈(上)

这篇文章主要是总结自己以前使用过的网络模型和服务器模型，和阅读过几个开源的实现怎么使用的，看到的文章[工作中不会经常写这些，都忘了差不多了]。介绍大概使用方法和原理，可能并不能与实际工作中的网络组件相媲美[哈哈]。

工作中自己是没有写过关于网络方面的程序，都是写业务逻辑方面，业务逻辑本身有一定的复杂度，不需要考虑消息的收发，连接的管理，是以消息驱动的形式处理的，模块间解耦。其实这些才是技术难点所在，大概实现是使用epoll实现的网络模型，收到的消息存在共享内存中，每个进程都关联两个消息队列，一个用于收消息，另一个用于发消息，使用无锁编程实现的，这个可以参考linux上的kfifo，还有连接/会话管理等等。

在开始之前需要先了解什么是阻塞和非阻塞，同步和异步。写过简单的网络程序或者使用api都会明白，要去做一件事情，比如应用层(用户态)read某个套接字，会切换到内核态，如果该套接字接收缓冲区有数据则返回，反正则被挂起等待事件发生，如果程序是单进程或某个线程发起的调用，那么会阻塞该进程或线程，不能干其他事情，效率就会降下来；如果是非阻塞，那么read时发现没有数据则立即返回一个错误码表示暂时没有数据，那么应用层可以暂时处理其他逻辑，但是还是要不断轮询数据是否可读，在非阻塞情况下效率会有明显提升。但数据是否可读还是要去询问，那么有没有办法不这样呢？那就是异步了，同步好理解，就是发出请求，在响应回来时只能干等，和阻塞的差不多，异步则是发出来请求，可以不等，然后响应回来后，以通知的形式告诉上层逻辑，有数据到了然后进行相应的逻辑处理。

这里仅列出自己常用的比较熟悉的网络I/O复用模型：select和epoll，原理是注册用户感兴趣的事件，比如套接字的可读和可写等，但他们本质上还是阻塞的，需要等待响应事件的到来。

int select(int nfds, fd_set * readfds, fd_set * writefds, fd_set * exceptfds, struct timeval * timeout)，对于的每个参数意义可以man 2 select，网上资料也有详细解释。

select的一些不足点：1)从select接口的原型得出文件描述符没有与具体的事件类型绑定，内核会对fd_set集合在线修改，使得下次调用时不得不重置这三个fd_set；2)每次select返回的是整个用户注册的事件集合，需要遍历每个描述符，判断哪些就绪，在活跃连接少的情况下，复杂度为O(N)；3)select可注册的文件描述符个数有上限；我的ubuntu系统上是1024个；4)select内部源码实现会每次准备时copy_from_user[用户态-->内核态]，就绪时copy_from_user[内核态-->用户态]，要拷贝fd_set集合，也是一笔开销；5)工作在相对低效的LT模式；

epoll三个函数原型：

int epoll_create(int size);

int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);

而epoll的出现解决了select的这些不足点：1)epoll将描述符和具体的事件类型绑定在一块，无需反复从用户态拷贝描述符到内核态；2)返回就绪的描述符，遍历到的都是有事件发生的，时间复杂度是O(1)；3)epoll可注册的文件描述符比select大很多，在我的系统上是188301；4)可以工作在高效的ET模式，当然也有LT模式[见下文]；

epoll为什么快？

一棵红黑树，用于“把socket放到epoll文件系统里file对象对应的红黑树上之外，向内核中断处理程序注册一个回调函数，告诉内核，如果这个句柄的中断到了，就把它放到就绪链表里；一个就绪链表；“当调用epoll_wait检查是否有事件发生时，只需要检查eventpoll对象中的链表中是否有epitem元素即可。如果rdlist不为空，则把发生的事件复制到用户态，同时将事件数量返回给用户”

epoll的两种工作模式ET/LT分析：

ET(edge trigger)边沿触发，当epoll_wait检测到有事件发生并通知应用程序后，如果不处理，那么后面就不会再通知该事件了。

LT(level trigger)水平触发，是epoll的默认工作模式，当epoll_wait检测到有事件发生并通知应用程序后，如果不处理或没有处理完，那么后面再epoll_wait时还会通知，直到该事件被处理。

“当一个socket句柄上有事件时，内核会把该句柄插入上面所说的准备就绪list链表，这时我们调用epoll_wait，会把准备就绪的socket拷贝到用户态内存，然后清空准备就绪list链表，最后，epoll_wait干了件事，就是检查这些socket，如果不是ET模式（就是LT模式的句柄了），并且这些socket上确实有未处理的事件时，又把该句柄放回到刚刚清空的准备就绪链表了。所以，非ET的句柄，只要它上面还有事件，epoll_wait每次都会返回。而ET模式的句柄，除非有新中断到，即使socket上的事件没有处理完，也是不会次次从epoll_wait返回的“

两种模式在socket可读/可写下的正确使用方法：

对于socket接收缓冲区有数据到达时[不可读到可读]，ET/LT模式需要把数据读完，当read返回EAGAIN或EWOULDBLOCK时，或者读到的字节数少于需要的，则表示读完；

对于socket发送缓冲区的状态从不可写到可写，需要发送数据时，先看看应用程序的缓存buffer中是否有数据，如果有，则表示发送缓冲区暂时不可写，需要把这部分缓存起来；如果没有数据，则直接调用send发送直到又不可写，那么在LT模式下，注册可写事件，当可写时发送数据，发送完毕后需要把该事件移走，否则就算没有数据要发送，也会通知；对于ET模式下，当可写时，检测应用程序的缓存是否有数据，有就发送；后者处理写事件比较简单。

两种I/O模型通用结构[单进程单线程模型下，伪代码]：

int iListenfd = socket();

int iRet = setnotblocking(iListenfd);

/**这里如果是阻塞的话，有链接的connect过来时，完成三次握手情况下，把链接从未完成三次握手队列中移至完成三次握手队列中，等待accept，如果此时客户端发来个RST，此时accept需要忽略ECONNABORTED错误并再次调用accept；**/

iRet = bind();

iRet = listen();

int ifdArray[DEFAULT_FD_MAX_COUNT]; /* 这里简单处理，不考虑越界*/

int ifdCount = 0;

fd_set fdRead;

maxfd = iListenfd;

while(true)

{

FD_ZERO(&fdRead);

FD_SET(iListenfd, &fdRead);

for (i = 0; i < ifdCount; ++ i)

{

FD_SET(ifdArray[i], &fdRead); //connect

}

//set timeout;

int iRet = select(maxfd + 1, &fdRead, NULL, NULL, NULL);

if (iRet < 0) { //error, break;}

if (iRet == 0) {//timeout, continue; }

for (int i = 0; i < ifdCount; ++ i)

{

if (FD_ISSET(ifdArray[i], &ifdRead))

{

//有数据可读，如果读到0则表示对端断开链接，需要从ifdArray[i]中移走；

}

if (FD_ISSET(iListenfd, &fdRead))

{

int iNewfd = accept(iListenfd);

if (iNewfd >= 0)

{

ifdArray[ifdCount ++] = iNewfd;

if (iNewfd > maxfd) { maxfd = iNewfd; }

}

else

{

//todo, skip ECONNABORTED error

}

其实select模型的使用很简单，但有几个注意点就是select的时候，会清除传进去的fd_set集合，需要在外面做个备份；然后select的第一个实参传进去的是当前最大描述符+1，因为在do_select底层实现中：for(i = 0; i < n; ++rinp, ++routp, ++rexp) {/*遍历所有fd*/；当select返回时需要对返回值判断是因为什么而返回；有新的链接过来时需要保存到ifdArray，下次select时需要监听；有链接关闭时，从ifdArray中移走；

查了下，accept返回为0也是正常的。上面的程序只是个大概，可能会有一些错误，和细节没有考虑进去。

未完。

linux下epoll如何实现高效处理百万句柄的

epoll实现机制分析

Linux-2.6.25 select系统调用源码分析

最后编辑于：2017.12.03 07:18:44

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,053评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,527评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,779评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,685评论 1赞 276
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,699评论 5赞 366
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,609评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,989评论 3赞 396
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,654评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,890评论 1赞 298
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,634评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,716评论 1赞 330
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,394评论 4赞 319
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,976评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,950评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,191评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 44,849评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,458评论 2赞 342

网络编程模型闲谈(上)

推荐阅读更多精彩内容