python并发之二:一篇文章搞懂python多进程(理论+实践)

python多进程

在上一篇博文中,我详细的讲解了python的多线程。在这篇博文中,我将对python的多进程部分进行细致讲解。

前言

在上一篇博文中我们提到,由于python多线程无法调度到处理器多个核心上并行执行,所以它更适用于IO密集型程序。而对于计算密集型的程序,就是python多进程大展身手的场合了。
由于windows系统和linux系统在进程实现的方式上相差很多,这里笔者不进行详细阐述,感兴趣的读者可以自行查阅。在这篇博文中,笔者所有的代码将全部运行在windows系统中。针对程序在linux平台上的不同实现的问题,读者可以给笔者留言。

进程的创建

python的多进程相关模块主要封装在multiprocessing库中,windows系统中父进程新建并启动一个子进程的代码及运行结果如下:

# windows版创建子进程的代码
from multiprocessing import Process
import os

# 子进程要执行的代码
def run_proc(name):
    print('子进程的进程号 %s (%s)...' % (name, os.getpid()))

if __name__=='__main__':
    print('父进程 %s 开始运行' % os.getpid())
    p = Process(target=run_proc, args=('test',))
    print('子进程开始运行')
    # 启动子进程
    p.start()
    # 等待子进程结束
    p.join()
    print('父进程结束')

运行结果为

父进程 422356 开始运行
子进程开始运行
子进程的进程号 test (453796)...
父进程结束

我们可以从运行结果中看到由进程号为422356的父进程创建进程号为453796的子进程并启动。程序中的start()函数和join()函数和多线程中的相应函数作用完全相同,分别表示启动进程和等待该进程运行结束,详细内容可以参考笔者的上一篇博客

利用进程池创建进程

在需要创建大量进程的场合,上文提到的方式就有些力不从心了。所以我们可以选择进程池的方式来创建大量进程。程序以及输出如下:

from multiprocessing import Pool
import os, time, random

def long_time_task(name):
    print('运行任务 %s (%s)...' % (name, os.getpid()))
    start = time.time()
    # 每个进程在[0, 3]秒之间随机睡眠一段时间
    time.sleep(random.random() * 3)
    end = time.time()
    print('任务 %s 运行时间 %0.2f 秒.' % (name, (end - start)))

if __name__=='__main__':
    print('父进程 %s.' % os.getpid())
    # pool默认为CPU核的数量,可以指定
    p = Pool()
    for i in range(6):
        p.apply_async(long_time_task, args=(i,))
    print('等待所有子进程结束...')
    p.close()
    p.join()
    print('所有子进程已运行结束.')

输出结果为:

父进程 393580.
等待所有子进程结束...
运行任务 0 (461268)...
运行任务 1 (355412)...
运行任务 2 (466252)...
运行任务 3 (454400)...
运行任务 4 (431068)...
运行任务 5 (452984)...
任务 0 运行时间 0.86 秒.
任务 2 运行时间 1.34 秒.
任务 5 运行时间 1.41 秒.
任务 3 运行时间 2.10 秒.
任务 1 运行时间 2.58 秒.
任务 4 运行时间 2.67 秒.
所有子进程已运行结束.

结果是显而易见的,6个进程同时启动,并在随机运行不同的时间后,依次结束运行,值得一提的是我在这里利用进程池启动了6个进程,而这个进程池实际最多能同时启动8个进程,8也是我的处理器核心数量,所以你如果在创建进程池时不给Pool()传入参数时,默认为你的处理器核心数量。

多进程运行计算密集型程序

口说无凭,笔者在这一部分展示一个多进程运行计算密集型程序的实例,笔者使用的是8核处理器,而在本程序中,我启动了8个进程分别运行计算密集型程序。程序以及利用windows的资源管理器观察CPU利用率如下

from multiprocessing import Pool
import os, time

def cal_intensity_task(name):
    print('运行任务 %s (%s)...' % (name, os.getpid()))
    start = time.time()
    # 每个进程在[0, 3]秒之间随机睡眠一段时间
    i = 1
    while(True):
        i = i ** 2
    end = time.time()
    print('任务 %s 运行时间 %0.2f 秒.' % (name, (end - start)))

if __name__=='__main__':
    print('父进程 %s.' % os.getpid())
    # pool默认为CPU核的数量,可以指定
    p = Pool()
    for i in range(8):
        p.apply_async(cal_intensity_task, args=(i,))
    print('等待所有子进程结束...')
    p.close()
    p.join()
    print('所有子进程已运行结束.')
image.png

我们可以看到,此时8个进程正在充分“压榨”CPU,而这一场景是大家在python多线程场合下无法看到的。python多进程的重要性也就显而易见了

多个进程之间的消息传递

说到并发程序,就不得不说同步,这一部分笔者将讲解一个消息传递的实例

from multiprocessing import Process, Queue
import time, random

# 写数据进程执行的代码:
def write(q):
    for value in ['A', 'B', 'C']:
        print('把值 %s 加入消息队列' % value)
        q.put(value)
        time.sleep(random.random())

# 读数据进程执行的代码:
def read(q):
    while True:
        value = q.get()
        print('从消息队列中获取值 %s ' % value)
        if q.empty():
            break

if __name__=='__main__':
    # 父进程创建Queue,并传给各个子进程:
    q = Queue()
    pw = Process(target=write, args=(q,))
    pr = Process(target=read, args=(q,))
    # 启动子进程pw,写入:
    pw.start()
    pw.join()
    # 启动子进程pr,读取:
    pr.start()
    # 等待pw结束:
    pr.join()

运行结果如下:

把值 A 加入消息队列
把值 B 加入消息队列
把值 C 加入消息队列
从消息队列中获取值 A
从消息队列中获取值 B
从消息队列中获取值 C

这里使用到了一个在多进程情况下安全的数据容器——消息队列,它可以保证两个进程对于队列中的元素的存取不会彼此干扰,因此可以保证程序的正确运行。

总结

以上就是笔者总结的python多进程的知识,结合上一篇python多线程的部分,希望读者也能对python的多线程与多进程有一定了解,并且读者可以与java多线程相比较,可以更容易理解相关的技术实现。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,390评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,821评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,632评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,170评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,033评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,098评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,511评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,204评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,479评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,572评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,341评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,213评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,576评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,893评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,171评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,486评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,676评论 2 335

推荐阅读更多精彩内容

  • 一. 操作系统概念 操作系统位于底层硬件与应用软件之间的一层.工作方式: 向下管理硬件,向上提供接口.操作系统进行...
    月亮是我踢弯得阅读 5,938评论 3 28
  • 必备的理论基础 1.操作系统作用: 隐藏丑陋复杂的硬件接口,提供良好的抽象接口。 管理调度进程,并将多个进程对硬件...
    drfung阅读 3,505评论 0 5
  • 又来到了一个老生常谈的问题,应用层软件开发的程序员要不要了解和深入学习操作系统呢? 今天就这个问题开始,来谈谈操...
    tangsl阅读 4,077评论 0 23
  • 顾名思义,进程即正在执行的一个过程。进程是对正在运行程序的一个抽象。进程的概念起源于操作系统,是操作系统最核心的概...
    SlashBoyMr_wang阅读 1,113评论 0 2
  • 进程 操作系统背景知识 顾名思义,进程即正在执行的一个过程。进程是对正在运行程序的一个抽象。 进程的概念起源于操作...
    go以恒阅读 928评论 0 2