定义
进程是具有一定独立功能的程序关于某个数据集合上的一次运行活动,进程是系统进行资源分配和调度的一个独立单位。
线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位。线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器、一组寄存器和栈),但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源。
关系
一个线程可以创建和撤销另一个线程。
一个线程只能属于一个进程,而一个进程可以有多个线程并发执行,但至少有一个线程(通常说的主线程)。
资源分配给进程,同一进程的所有线程共享该进程的所有资源。
线程在执行过程中,需要协作同步。不同进程的线程间要利用消息通信的办法实现同步。
处理机分给线程,即真正在处理机上运行的是线程。
区别
根本区别就一点:进程有自己的地址空间,线程则共享地址空间。所有其它区别都是由此而来的:
一个进程崩溃后,在保护模式下不会对其它进程产生影响,而线程只是一个进程中的不同执行路径。线程有自己的堆栈和局部变量,但线程之间没有单独的地址空间,一个线程死掉就等于整个进程死掉,所以多进程的程序要比多线程的程序健壮
资源利用率:线程的资源利用率比较好,因为他们在同一个地址空间内
同步问题:线程使用公共变量、内存时需要使用同步机制,因为他们在同一个地址空间内
线程的划分尺度小于进程,所以产生速度快,切换速度快
线程作为 CPU 调度的基本单位,进程作为资源分配的基本单位,线程不拥有系统资源,但可以访问隶属于进程的资源
通讯方式:进程之间传递数据只能是通过通讯的方式,即费时又不方便。线程之间数据大部分共享(线程函数内部不共享),快捷方便。但是数据同步需要锁,对于 static 变量尤其注意
执行过程:每个独立的线程有一个程序运行的入口、顺序执行序列和程序的出口。但是线程不能够独立执行,必须依存在进程中
逻辑角度:多线程的意义在于一个应用程序中,有多个执行部分可以同时执行。但操作系统并没有将多个线程看做多个独立的应用,来实现进程的调度和管理以及资源分配
优缺点
线程和进程在使用上各有优缺点:线程执行开销小,资源利用率也比较好,但不利于资源的管理和保护;而进程正相反。同时,线程适合于在多核处理机上运行,而进程则可以跨机器迁移。
适用范围
需要频繁创建销毁的优先用线程
这种原则最常见的应用就是 Web 服务器了,来一个连接建立一个线程,断了就销毁线程,要是用进程,创建和销毁的代价是很难承受的需要进行大量计算的优先使用线程
所谓大量计算,当然就是要耗费很多 CPU,切换频繁了,这种情况下线程是最合适的。
这种原则最常见的是图像处理、算法处理。强相关的处理用线程,弱相关的处理用进程
什么叫强相关、弱相关?理论上很难定义,给个简单的例子就明白了。
一般的 Server 需要完成如下任务:消息收发、消息处理。“消息收发”和“消息处理”就是弱相关的任务,而“消息处理”里面可能又分为“消息解码”、“业务处理”,这两个任务相对来说相关性就要强多了。因此“消息收发”和“消息处理”可以分进程设计,“消息解码”、“业务处理”可以分线程设计。可能要扩展到多机分布的用进程,多核分布的用线程