Python进程、线程、协程

进程

进程是指一个程序在给定数据集合上的一次执行过程,是系统进行资源分配和运行调用的独立单位。
可以简单地理解为操作系统中正在执行的程序。也就说,每个应用程序都有一个自己的进程。

每一个进程启动时都会最先产生一个唯一线程,即主线程,然后主线程会再创建其他的子线程。

线程

线程是一个基本的CPU执行单元。它必须依托于进程存活。一个线程是一个execution context(执行上下文),即一个CPU执行时所需要的一串指令。

协程

协程是一种用户态的轻量级线程,协程的调度完全由用户控制。
从技术的角度来说,“协程就是你可以暂停执行的函数”。协程拥有自己的寄存器上下文和栈。
协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈,直接操作栈则基本没有内核切换的开销。
可以不加锁的访问全局变量,所以上下文的切换非常快。

进程和线程的区别

  • 线程必须在某个进程中执行。
  • 一个进程可包含多个线程,其中有且只有一个主线程。
  • 多线程共享同个地址空间、打开的文件以及其他资源。
  • 多进程共享物理内存、磁盘、打印机以及其他资源。
  • 线程是处理器调度的基本单位,但进程不是

线程的类型

线程的因作用可以划分为不同的类型。大致可分为:

  • 主线程
  • 子线程
  • 后台线程(守护线程)
  • 前台线程

GIL(全局解释性锁)

其他语言,CPU是多核时是支持多个线程同时执行。但在Python中,无论是单核还是多核,同时只能由一个线程在执行。其根源是GIL的存在。GIL的全称是Global Interpreter Lock(全局解释器锁),来源是Python设计之初的考虑,为了数据安全所做的决定。某个线程想要执行,必须先拿到GIL,我们可以把GIL看作是“通行证”,并且在一个Python进程中,GIL只有一个。拿不到通行证的线程,就不允许进入CPU执行。

GIL只在CPython中才有,而在PyPy和Jython中是没有GIL的,CPython版本的解释器最常用。

并且由于GIL锁存在,Python里一个进程永远只能同时执行一个线程(拿到GIL的线程才能执行),这就是为什么在多核CPU上,Python 的多线程效率并不高的根本原因。

GIL锁和线程锁(互斥锁)的区别

1. GIL锁是解释层面的锁,而线程锁是代码层面的锁。
2. 线程没拿到GIL锁时,不能进入CPU执行,而没拿到互斥锁时,不能修改数据
例:
  假设只有1个进程,有线程1、线程2要修改共享数据data,并且有互斥锁。
  多线程运行,假设线程1拿到了GIL锁进入了CPU执行,此时线程1获得了互斥锁,可以进行数据的修改,但还未进行修改。
  线程1在修改data前,进行了IO操作或 ticks计数满100,让出了GIL锁,假设线程2竞争获得了GIL锁,可以进入CPU执行。
  此时线程2执行修改共享数据data的代码,但由于线程1拥有互斥锁,因而线程2并不能进行修改data数据,这时线程2让出GIL锁,GIL锁再次发生竞争。
  假设线程1获得了GIL锁,可以进入CPU执行,因为线程1还拥有互斥锁,所以其可以继续对共享数据进行修改,修改完成后释放互斥锁。
  当线程2得到了GIL锁以及互斥锁后,可以进入CPU执行,并修改共享数据data。

Python 对并发编程的支持

  • 多线程:【threading】,利用CPU和IO同时执行的原理,让CPU不会干巴巴等待IO完成

  • 多进程:【multiprocessing】,利用多核CPU的能力,真正的执行任务

  • 异步IO:【asyncio】,在单线程利用CPU和IO同时执行的原理,实现函数异步执行

  • 可以使用【Lock】对资源进行加锁,防止冲突

  • 使用【Queue】实现不同线程/进程间的通信,实现生产者/消费者模式

  • 使用线程池【ThreadPoolExecutor】/进程池【ProcessPoolExecutor】,简化线程/进程的任务提交、等待结束、获取结果

多进程、多线程、多协程的对比

一个进程开启的数量有限,这取决于CPU的限制

优点:可以利用多核CPU并行运算
缺点:占用资源最多,可以启动的数量比线程少
适用于:CPU密集型计算,例如:加解密、大数据、机器学习、正则表达式匹配等

一个进程中可以开启N个线程

优点:相比进程,更轻量,占用资源更少
缺点:
      - 相比进程:多线程只能并发执行,不能利用多CPU(GIL)
      - 相比协程:启动数目有限制,占用内存资源,有线程切换开销
适用于:I/O密集型计算,例如:api接口获取数据、爬虫、数据库或文件频繁读写等

一个线程可以开启N个协程,协程占用内存甚至只需要几Kb

优点:内存占用最小,启动数目最多
缺点:支持的库有限制,例如不能使用requtests,而要aiohttp或httpx,并且代码实现复杂
适用于:I/O密集型计算,需要超多任务执行,但有现成库支持的场景

如何选择使用合适的技术

1.首先判断任务类型,判断任务属于CPU密集型,还是IO密集型
2.如果任务属于CPU密集型 ==> 选择多进程
3.如果任务属于IO密集型:
                       - 判断任务是否需要超多的任务量,并且有现有协程库支持,并且可以接受其实现复杂度 ==> 选择多协程
                       - 否则 ==> 选择多线程

线程池使用的好处

提升性能:减去大量新建、终止线程的开销,重用了线程资源
适用场景:适合处理突发性大量请求或需要大量线程完成任务、但实际任务处理时间较短
防御功能:能有效避免系统创建线程过多,而导致系统负荷过大、变慢的问题
代码优势:使用线程池的语法,比自己创建执行线程更简洁

threading 和 multiprocessing对比

协程

在单线程内实现并发

核心原理1:用一个超级循环(实际上就是while...true循环)
核心原理2:配合IO多路复用原理(IO时CPU可以干其他事情)

信号量、旗语【Semaphore】

是一个同步对象,用于保持0到指定最大值之间的一个计数值,简而言之,用以控制并发量

简单案例

import aiohttp
import asyncio

loop = asyncio.get_event_loop()

# 当放开下面代码时,每次执行10个任务后会停下等待一会,当然,最终程序爬取完成时间会变长
# semaphore = asyncio.Semaphore(10)

async def async_crawl(url):
    async with aiohttp.ClientSession() as session:
        async with session.get(url) as resp:
            result = await resp.text()
            await asyncio.sleep(5)
            print(f'请求地址:{url},{len(result)}')



if __name__ == '__main__':

    t1 = time.time()

    task_list = [loop.create_task(async_crawl(f'https://pic.netbian.com/index_{page}.html')) for page in range(50)]
    loop.run_until_complete(asyncio.wait(task_list))

    t2 = time.time()

    print(t2-t1)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,802评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,109评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,683评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,458评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,452评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,505评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,901评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,550评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,763评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,556评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,629评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,330评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,898评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,897评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,140评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,807评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,339评论 2 342

推荐阅读更多精彩内容