Python进程、线程、协程

进程

进程是指一个程序在给定数据集合上的一次执行过程，是系统进行资源分配和运行调用的独立单位。
可以简单地理解为操作系统中正在执行的程序。也就说，每个应用程序都有一个自己的进程。

每一个进程启动时都会最先产生一个唯一线程，即主线程，然后主线程会再创建其他的子线程。

线程

线程是一个基本的CPU执行单元。它必须依托于进程存活。一个线程是一个execution context（执行上下文），即一个CPU执行时所需要的一串指令。

协程

协程是一种用户态的轻量级线程，协程的调度完全由用户控制。
从技术的角度来说，“协程就是你可以暂停执行的函数”。协程拥有自己的寄存器上下文和栈。
协程调度切换时，将寄存器上下文和栈保存到其他地方，在切回来的时候，恢复先前保存的寄存器上下文和栈，直接操作栈则基本没有内核切换的开销。
可以不加锁的访问全局变量，所以上下文的切换非常快。

进程和线程的区别

线程必须在某个进程中执行。
一个进程可包含多个线程，其中有且只有一个主线程。
多线程共享同个地址空间、打开的文件以及其他资源。
多进程共享物理内存、磁盘、打印机以及其他资源。
线程是处理器调度的基本单位,但进程不是

线程的类型

线程的因作用可以划分为不同的类型。大致可分为：

主线程
子线程
后台线程（守护线程）
前台线程

GIL（全局解释性锁）

其他语言，CPU是多核时是支持多个线程同时执行。但在Python中，无论是单核还是多核，同时只能由一个线程在执行。其根源是GIL的存在。GIL的全称是Global Interpreter Lock(全局解释器锁)，来源是Python设计之初的考虑，为了数据安全所做的决定。某个线程想要执行，必须先拿到GIL，我们可以把GIL看作是“通行证”，并且在一个Python进程中，GIL只有一个。拿不到通行证的线程，就不允许进入CPU执行。

GIL只在CPython中才有，而在PyPy和Jython中是没有GIL的,CPython版本的解释器最常用。

并且由于GIL锁存在，Python里一个进程永远只能同时执行一个线程(拿到GIL的线程才能执行)，这就是为什么在多核CPU上，Python 的多线程效率并不高的根本原因。

GIL锁和线程锁(互斥锁)的区别

1. GIL锁是解释层面的锁，而线程锁是代码层面的锁。
2. 线程没拿到GIL锁时，不能进入CPU执行，而没拿到互斥锁时，不能修改数据
例：
  假设只有1个进程，有线程1、线程2要修改共享数据data，并且有互斥锁。
  多线程运行，假设线程1拿到了GIL锁进入了CPU执行，此时线程1获得了互斥锁，可以进行数据的修改，但还未进行修改。
  线程1在修改data前，进行了IO操作或 ticks计数满100，让出了GIL锁，假设线程2竞争获得了GIL锁，可以进入CPU执行。
  此时线程2执行修改共享数据data的代码，但由于线程1拥有互斥锁，因而线程2并不能进行修改data数据，这时线程2让出GIL锁，GIL锁再次发生竞争。
  假设线程1获得了GIL锁，可以进入CPU执行，因为线程1还拥有互斥锁，所以其可以继续对共享数据进行修改，修改完成后释放互斥锁。
  当线程2得到了GIL锁以及互斥锁后，可以进入CPU执行，并修改共享数据data。

Python 对并发编程的支持

多线程：【threading】，利用CPU和IO同时执行的原理，让CPU不会干巴巴等待IO完成
多进程：【multiprocessing】，利用多核CPU的能力，真正的执行任务
异步IO：【asyncio】，在单线程利用CPU和IO同时执行的原理，实现函数异步执行
可以使用【Lock】对资源进行加锁，防止冲突
使用【Queue】实现不同线程/进程间的通信，实现生产者/消费者模式
使用线程池【ThreadPoolExecutor】/进程池【ProcessPoolExecutor】，简化线程/进程的任务提交、等待结束、获取结果

多进程、多线程、多协程的对比

一个进程开启的数量有限，这取决于CPU的限制

优点：可以利用多核CPU并行运算
缺点：占用资源最多，可以启动的数量比线程少
适用于：CPU密集型计算，例如：加解密、大数据、机器学习、正则表达式匹配等

一个进程中可以开启N个线程

优点：相比进程，更轻量，占用资源更少
缺点：
      - 相比进程：多线程只能并发执行，不能利用多CPU（GIL）
      - 相比协程：启动数目有限制，占用内存资源，有线程切换开销
适用于：I/O密集型计算，例如：api接口获取数据、爬虫、数据库或文件频繁读写等

一个线程可以开启N个协程，协程占用内存甚至只需要几Kb

优点：内存占用最小，启动数目最多
缺点：支持的库有限制，例如不能使用requtests，而要aiohttp或httpx，并且代码实现复杂
适用于：I/O密集型计算，需要超多任务执行，但有现成库支持的场景

如何选择使用合适的技术

1.首先判断任务类型，判断任务属于CPU密集型，还是IO密集型
2.如果任务属于CPU密集型 ==> 选择多进程
3.如果任务属于IO密集型：
                       - 判断任务是否需要超多的任务量，并且有现有协程库支持，并且可以接受其实现复杂度 ==> 选择多协程
                       - 否则 ==> 选择多线程

线程池使用的好处

提升性能：减去大量新建、终止线程的开销，重用了线程资源
适用场景：适合处理突发性大量请求或需要大量线程完成任务、但实际任务处理时间较短
防御功能：能有效避免系统创建线程过多，而导致系统负荷过大、变慢的问题
代码优势：使用线程池的语法，比自己创建执行线程更简洁

threading 和 multiprocessing对比

协程

在单线程内实现并发

核心原理1：用一个超级循环（实际上就是while...true循环）
核心原理2：配合IO多路复用原理（IO时CPU可以干其他事情）

信号量、旗语【Semaphore】

是一个同步对象，用于保持0到指定最大值之间的一个计数值，简而言之，用以控制并发量

简单案例

import aiohttp
import asyncio

loop = asyncio.get_event_loop()

# 当放开下面代码时，每次执行10个任务后会停下等待一会，当然，最终程序爬取完成时间会变长
# semaphore = asyncio.Semaphore(10)

async def async_crawl(url):
    async with aiohttp.ClientSession() as session:
        async with session.get(url) as resp:
            result = await resp.text()
            await asyncio.sleep(5)
            print(f'请求地址：{url},{len(result)}')



if __name__ == '__main__':

    t1 = time.time()

    task_list = [loop.create_task(async_crawl(f'https://pic.netbian.com/index_{page}.html')) for page in range(50)]
    loop.run_until_complete(asyncio.wait(task_list))

    t2 = time.time()

    print(t2-t1)

最后编辑于：2024.02.27 11:00:41

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,802评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,109评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,683评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,458评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,452评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,505评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,901评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,550评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,763评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,556评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,629评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,330评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,898评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,897评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,140评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,807评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,339评论 2赞 342