网络编程模型闲谈(上)

这篇文章主要是总结自己以前使用过的网络模型和服务器模型,和阅读过几个开源的实现怎么使用的,看到的文章[工作中不会经常写这些,都忘了差不多了]。介绍大概使用方法和原理,可能并不能与实际工作中的网络组件相媲美[哈哈]。

工作中自己是没有写过关于网络方面的程序,都是写业务逻辑方面,业务逻辑本身有一定的复杂度,不需要考虑消息的收发,连接的管理,是以消息驱动的形式处理的,模块间解耦。其实这些才是技术难点所在,大概实现是使用epoll实现的网络模型,收到的消息存在共享内存中,每个进程都关联两个消息队列,一个用于收消息,另一个用于发消息,使用无锁编程实现的,这个可以参考linux上的kfifo,还有连接/会话管理等等。

在开始之前需要先了解什么是阻塞和非阻塞,同步和异步。写过简单的网络程序或者使用api都会明白,要去做一件事情,比如应用层(用户态)read某个套接字,会切换到内核态,如果该套接字接收缓冲区有数据则返回,反正则被挂起等待事件发生,如果程序是单进程或某个线程发起的调用,那么会阻塞该进程或线程,不能干其他事情,效率就会降下来;如果是非阻塞,那么read时发现没有数据则立即返回一个错误码表示暂时没有数据,那么应用层可以暂时处理其他逻辑,但是还是要不断轮询数据是否可读,在非阻塞情况下效率会有明显提升。但数据是否可读还是要去询问,那么有没有办法不这样呢?那就是异步了,同步好理解,就是发出请求,在响应回来时只能干等,和阻塞的差不多,异步则是发出来请求,可以不等,然后响应回来后,以通知的形式告诉上层逻辑,有数据到了然后进行相应的逻辑处理。

这里仅列出自己常用的比较熟悉的网络I/O复用模型:select和epoll,原理是注册用户感兴趣的事件,比如套接字的可读和可写等,但他们本质上还是阻塞的,需要等待响应事件的到来。

int select(int nfds, fd_set * readfds, fd_set * writefds, fd_set * exceptfds, struct timeval * timeout),对于的每个参数意义可以man 2 select,网上资料也有详细解释。

select的一些不足点:1)从select接口的原型得出文件描述符没有与具体的事件类型绑定,内核会对fd_set集合在线修改,使得下次调用时不得不重置这三个fd_set;2)每次select返回的是整个用户注册的事件集合,需要遍历每个描述符,判断哪些就绪,在活跃连接少的情况下,复杂度为O(N);3)select可注册的文件描述符个数有上限;我的ubuntu系统上是1024个;4)select内部源码实现会每次准备时copy_from_user[用户态-->内核态],就绪时copy_from_user[内核态-->用户态],要拷贝fd_set集合,也是一笔开销;5)工作在相对低效的LT模式;

epoll三个函数原型:

int epoll_create(int size);

int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);

而epoll的出现解决了select的这些不足点:1)epoll将描述符和具体的事件类型绑定在一块,无需反复从用户态拷贝描述符到内核态;2)返回就绪的描述符,遍历到的都是有事件发生的,时间复杂度是O(1);3)epoll可注册的文件描述符比select大很多,在我的系统上是188301;4)可以工作在高效的ET模式,当然也有LT模式[见下文];

epoll为什么快?

一棵红黑树,用于“把socket放到epoll文件系统里file对象对应的红黑树上之外,向内核中断处理程序注册一个回调函数,告诉内核,如果这个句柄的中断到了,就把它放到就绪链表里;一个就绪链表;“当调用epoll_wait检查是否有事件发生时,只需要检查eventpoll对象中的链表中是否有epitem元素即可。如果rdlist不为空,则把发生的事件复制到用户态,同时将事件数量返回给用户”

epoll的两种工作模式ET/LT分析:

ET(edge trigger)边沿触发,当epoll_wait检测到有事件发生并通知应用程序后,如果不处理,那么后面就不会再通知该事件了。

LT(level trigger)水平触发,是epoll的默认工作模式,当epoll_wait检测到有事件发生并通知应用程序后,如果不处理或没有处理完,那么后面再epoll_wait时还会通知,直到该事件被处理。

“当一个socket句柄上有事件时,内核会把该句柄插入上面所说的准备就绪list链表,这时我们调用epoll_wait,会把准备就绪的socket拷贝到用户态内存,然后清空准备就绪list链表,最后,epoll_wait干了件事,就是检查这些socket,如果不是ET模式(就是LT模式的句柄了),并且这些socket上确实有未处理的事件时,又把该句柄放回到刚刚清空的准备就绪链表了。所以,非ET的句柄,只要它上面还有事件,epoll_wait每次都会返回。而ET模式的句柄,除非有新中断到,即使socket上的事件没有处理完,也是不会次次从epoll_wait返回的“

两种模式在socket可读/可写下的正确使用方法:

对于socket接收缓冲区有数据到达时[不可读到可读],ET/LT模式需要把数据读完,当read返回EAGAIN或EWOULDBLOCK时,或者读到的字节数少于需要的,则表示读完;

对于socket发送缓冲区的状态从不可写到可写,需要发送数据时,先看看应用程序的缓存buffer中是否有数据,如果有,则表示发送缓冲区暂时不可写,需要把这部分缓存起来;如果没有数据,则直接调用send发送直到又不可写,那么在LT模式下,注册可写事件,当可写时发送数据,发送完毕后需要把该事件移走,否则就算没有数据要发送,也会通知;对于ET模式下,当可写时,检测应用程序的缓存是否有数据,有就发送;后者处理写事件比较简单。

两种I/O模型通用结构[单进程单线程模型下,伪代码]:

int iListenfd = socket();

int iRet = setnotblocking(iListenfd);

/**这里如果是阻塞的话,有链接的connect过来时,完成三次握手情况下,把链接从未完成三次握手队列中移至完成三次握手队列中,等待accept,如果此时客户端发来个RST,此时accept需要忽略ECONNABORTED错误并再次调用accept;**/

iRet = bind();

iRet = listen();

int ifdArray[DEFAULT_FD_MAX_COUNT]; /* 这里简单处理,不考虑越界*/

int ifdCount = 0;

fd_set fdRead;

maxfd = iListenfd;

while(true)

{

    FD_ZERO(&fdRead);

    FD_SET(iListenfd, &fdRead);

    for (i = 0; i < ifdCount; ++ i)

    {

          FD_SET(ifdArray[i], &fdRead);  //connect

    }

    //set timeout;

    int iRet = select(maxfd + 1, &fdRead, NULL, NULL, NULL);

    if (iRet < 0)  { //error, break;}

    if (iRet == 0) {//timeout, continue; }

    for (int i = 0; i < ifdCount; ++ i)

    {

        if (FD_ISSET(ifdArray[i], &ifdRead))

        {

                //有数据可读,如果读到0则表示对端断开链接,需要从ifdArray[i]中移走;

        }

  }

    if (FD_ISSET(iListenfd, &fdRead))

   {

        int iNewfd = accept(iListenfd);

        if (iNewfd >= 0)

        {

               ifdArray[ifdCount ++] = iNewfd;

               if (iNewfd > maxfd) { maxfd = iNewfd; }

        }

        else

        {

             //todo, skip ECONNABORTED error

         }

    }

}

其实select模型的使用很简单,但有几个注意点就是select的时候,会清除传进去的fd_set集合,需要在外面做个备份;然后select的第一个实参传进去的是当前最大描述符+1,因为在do_select底层实现中:for(i = 0; i < n; ++rinp, ++routp, ++rexp) {/*遍历所有fd*/;当select返回时需要对返回值判断是因为什么而返回;有新的链接过来时需要保存到ifdArray,下次select时需要监听;有链接关闭时,从ifdArray中移走;

查了下,accept返回为0也是正常的。上面的程序只是个大概,可能会有一些错误,和细节没有考虑进去。

未完。

linux下epoll如何实现高效处理百万句柄的

epoll实现机制分析

Linux-2.6.25 select系统调用源码分析

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,053评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,527评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,779评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,685评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,699评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,609评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,989评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,654评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,890评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,634评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,716评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,394评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,976评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,950评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,191评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,849评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,458评论 2 342

推荐阅读更多精彩内容