并发编程
三种构造并发程序的方式:
基于进程的并发编程、基于IO多路复用的并发编程、基于线程的并发编程
1、 基于进程的并发编程
Fork、exec waitpid 构造进程。
并发服务器:父进程中接受客户端连接请求,创建一个子进程为每个新客户端提供服务。
服务器接受了客户端1的连接请求,当前服务器拥有connfd(4) 和 listenfd(3)两个描述符,客户端有clientfd一个描述符。接受连接请求后,服务器派生一个子进程,该子进程获得服务器描述符表的完整拷贝。子进程关闭监听描述符,父进程关闭已连接描述符4,不再需要这些描述符。子进程忙于为客户端提供服务,父子进程已连接描述符都指向同一文件表表项,父进程关闭已连接描述符,否则将永远不会释放已连接描述符4的文件表条目,可能会引起存储器泄露,耗尽可用的存储器,使系统崩溃。因为套接字的文件表表项中的引用计数,直到父子进程的connfd都关闭了,到客户端的连接才会终止。
优点:简单
缺点:进程间通信代价大,进程之间共享文件表。但不共享用户地址空间,独立地址空间使得进程共享状态信息困难。必须显示IPC进行进程间通信,进程控制和IPC开销很高。Waitpid unix信号量 套接字接口 unixIPC(管道 先进先出 系统V共享存储器 系统V信号量)
2、 基于IO多路复用的并发编程
使用select函数处理描述符集合,要求内核挂起进程,只有在一个或多个IO事件发生后,才将控制返回给应用程序。
Select函数一直阻塞直到读描述符集合中至少有一个准备好可以读了,当且仅当一个从该描述符读取一个字节的请求不会阻塞时,该描述符准备好可以读了。
IO多路复用可以作为并发事件驱动程序的基础。将逻辑流模型化为状态机。一个状态机是由一组状态、输入事件和转移,转移是将输入事件和状态映射到状态。每个转移都将一个(输入状态、输入事件)对映射到一个输出状态。自循环是同一输入输出状态之间的转移。状态机可以化成有向图。一个状态机从某种初始状态开始执行,每个输入事件都会引发一个从当前状态到下一个状态的转移。
每个新客户端k,基于io多路复用的并发服务器会创建一个新的状态机Sk,将它和已连接描述符Dk联系起来。每个状态机Sk有一个状态(“等待描述符Dk准备好可读”)、输入事件(“描述符Dk准备好可读”)和一个转移(“从描述符Dk读一个文本行”)
服务器使用IO多路复用,借助select函数检测输入事件的发生。当每个已连接描述符准备好可读时,服务器就为相应的状态机执行转移。
优点:单一进程上下文,流之间共享数据容易。
缺点:编码复杂、不能充分利用多核处理器
3、 基于线程的并发编程
运行在进程上下文的逻辑流,一个进程同时运行多个线程,线程由内核调度,每个线程都有自己的线程上下文(thread context),一个唯一的整数线程ID、栈、栈指针、程序计数器、通用目的寄存器和条件码。一个进程内的运行线程共享该进程的用户虚拟地址空间。同进程一样,内核自动调度线程,通过一个整数ID识别线程。同IO多路复用,多个线程运行在单一进程的上下文中,以共享该进程整个虚拟地址空间的整个内容-代码、数据、堆、共享库和打开的文件。
每个进程开始声明周期都是单一线程,主线程(main tread),某一时刻主线程创建对等线程,两个线程并发运行,控制可以通过上下文切换传递到对等线程。
线程的上下文比进程的上下文小得多,切换也会更快。线程没有进程那种严格的父子关系。和一个进程相关的线程组成一个线程池,独立于其他进程的线程。主线程和其他线程的唯一区别就是进程中第一个运行的线程,线程池中,一个线程可以杀死任何对等线程,每个对等线程都能读写相同的共享数据。
信号量同步线程 实现互斥 调度共享资源
线程安全:不保护共享变量的函数、保持跨越多个调用的状态的函数、返回指向静态变量的指针的函数、调用线程不安全函数的函数
因为线程运行在同一进程中,共享相同的描述符表,无论多少线程使用该描述符表,已连接描述符表的引用计数都等于1,使用结束后,一个close函数足以释放与这个已连接描述符相关的存储器资源了。