简介
线程是允许应用程序并发执行多个任务的一种机制。一个进程可以包含多个线程,同一程序中的所有线程均会独立执行相同程序,且共享同一份全局内存区域、其中包括初始化数据段、未初始化数据段、以及内存段。
4个线程的进程图:
进程VS线程:
- 进程间的信息难以共享。由于除去只读代码段外,父子进程并未共享内存,因此必须采用一些进程间通信(IPC)的方式,在进程间进行信息交换。
- 调用fork()创建进程的代价相对较高,创建线程要快于创建进程,线程间上下文切换器消耗时间一般比进程要短。
- 多线程编程时,需要保证线程安全。
- 某个线程的bug可能会危及该进程的所有线程,因为它们共享着相同的地址空间和其他属性。相比之下,进程间隔离更彻底。
- 每个线程都在争用宿主进程中有限的虚拟地址空间。
线程共享的一些属性:
- 全局内存
- 进程ID和父进程ID
- 进程组ID和会话ID
- 控制终端
- 进程凭证
- 打开的文件描述符
- 由fcntl()创建的记录锁
- 信号处置
- 文件系统的相关信息
- ...
线程同步
互斥量
临界区是指访问某一共享资源的代码片段,并且这段代码的执行应为原子操作,亦即,同时访问同一共享资源的其他线程不应中断该片段的执行。
为了避免线程更新共享变量时所出现问题,必须使用互斥量来确保同时仅有一个线程可以访问某项共享资源,可以使用互斥量来保证任意共享资源的原子访问。
互斥量有两种状态:已锁定和未锁定。
任何时候,至多只有一个线程可以锁定该互斥量,试图对已经锁定的某一互斥量再次加锁,将可能阻塞线程或者报错失败。
两个方法:
pthread_mutex_lock
pthread_mutex_unlock
互斥量的死锁:有时,一个线程需要同时访问两个或更多不同的共享资源,而每个资源又都由不同的互斥量管理。当超过一个线程加锁同一组互斥量时,就有可能发生死锁。
要避免此类死锁问题,当多个线程对一组互斥锁操作时,总是应该以相同顺序对该组互斥量进行锁定。
条件变量
互斥量防止多个线程同时访问同一共享变量,条件变量允许一个线程就某个共享变量的状态变化通知其他线程,并让其他线程等待(阻塞)这一通知。
线程安全
若函数可同时供多个线程安全调用,则称之为线程安全函数,反之,如果函数不是线程安全的,则不能并发调用。(比如函数中修改了全局或静态变量,那么多个线程之间是共享这个数据的,不能保证最终的结果)
实现线程安全的方式:
- 将函数与互斥量关联使用(并发性能下降)
- 仅在函数中操作共享变量(临界区)的代码前后加入互斥锁
重入:重入函数不在连续的调用中保存静态数据,也不返回指向静态数据的指针。所有的数据都是由函数的调用程序提供的。重入函数不得调用非重入函数。
可重入函数则无需使用互斥量即可实现线程安全,其要诀在于避免对全局和静态变量的使用,需要返回给调用者的任何信息,亦或是需要在对函数的历次调用间加以维护的信息,都存储于调用者分配的缓冲区内。
线程取消
函数pthread_cancel()
向由thread指定的线程发送一个取消请求,要求目标线程终止。该方法会立即返回,不会等待目标线程取消后再返回。
目标线程如何响应,取决于其取消性状态和类型,如果禁用线程的取消性状态,那么请求会保持挂起状态,直至将线程的取消性状态置为启用,如果启用取消性状态,那么线程何时响应请求则依赖于取消性类型。若类型为延迟取消,则在线程下一次调用某个取消点时,取消发生。如果为异步取消类型,取消动作随时可能发生。
线程可以设置一个清理函数栈,其中的清理函数属于由开发人员定义的函数,当线程遭到取消时,会自动调用这些函数以执行清理工作(例如,恢复共享变量状态,或解锁互斥量)
线程栈
创建线程时,每个线程都有一个属于自己的线程栈,且大小固定,除主线程外的所有线程,其栈的缺省大小均为2MB。