在 Django 中使用 Celery 来进行耗时操作

最近在实验室中做一个项目（心酸啊，本想安安静静的清清闲闲的毕业的，没想到。。。），要把实验室发过的论文中的一些算法集成到一个 Web 服务器上，用户可以上传数据，还可以在 Web 上看到计算结果的可视化图表。整个服务器的后台是使用 Django 框架来搭建的，这些算法需要处理一定量的数据，使用了 numpy，pandas，scipy 等数值计算库，每一组数据的处理有时候需要跑好几个小时。为了合理的调度这些算法，我们这里使用了 Celery。

1. Django 处理 Request 的基本流程

Django 流程示意图

上面的这一张是网络上的 Django 处理 request 的流程示意图。大致意思就是：

浏览器发起 http 请求 ----> http handling（request 解析） ----> url 匹配（正则匹配找到对应的 View） ----> 在View中进行逻辑的处理与数据计算（包括调用 Model 类进行数据库的增删改查）----> 将数据推送到 template，返回对应的 template/response。

对于一些简单的操作，可以放在 View 中处理。在View处理任务时用户处于等待状态，直到页面返回结果。但是对于一些复杂的操作，则在 View 中应该先返回 response，再在后台处理任务。用户无需等待。当任务处理完成时，我们可以再通过 Ajax 之类的方式告知用户。

Celery 就是基于 Python 开发的一个分布式任务队列框架，支持使用任务队列的方式在分布的机器/进程/线程上执行任务调度。

2. Celery

Celery 的基本架构

上图是 Celery 的基本架构，它采用典型的生产生--消费者模式，主要由三部分组成：broker（消息队列）、workers（消费者：处理任务）、backend（存储结果）。实际应用中，用户从 Web 前端发起一个请求，我们只需要将请求所要处理的任务丢入任务队列 broker 中，由空闲的 worker 去处理任务即可，处理的结果会暂存在后台数据库 backend 中。我们可以在一台机器或多台机器上同时起多个 worker 进程来实现分布式地并行处理任务。

3. 安装 Celery

安装过程就是直接按照官网上的文档安装即可。我这里用的均是目前的最新稳定版。

macOS Sierra 10.12.3
Django 1.10
Celery 4.0.2

在早前版本的 Celery 中，有一个专门供 Django 使用的 Celery 版本：django-celery。但是在现在 Celery 已经统一为一个版本，所以直接安装原生的 Celery 即可：

pip install celery

Celery 推荐使用 RabbitMQ，Redis，Amazon SQS，Zookeeper，这几个作为 broker，但是只有前两个支持在生产环境使用。下面的表格对比了几种 broker。

Name	Status	Monitoring	Remote Control
RabbitMQ	Stable	Yes	Yes
Redis	Stable	Yes	Yes
Amazon SQS	Stable	No	No
Zookeeper	Experimental	No	No

我是使用 Redis 作为 broker 的。除了安装 redis 之外，还应该安装 redis 的 python 支持库。

安装 Redis：

brew install redis

安装 redis 的 python 支持库:

pip install redis

输入 redis-server 来开启 redis。当你看见下面的图案时，就说明成功开启了 redis。redis 默认监听 6379 端口。开启之后可以用 ctrl+c 来退出。

开启 redis

4. 把 Celery 配置到 Django 上

假设你有一个项目 proj：

- proj/
  - proj/__init__.py
  - proj/settings.py
  - proj/urls.py
- manage.py

Celery 建议在 proj/proj/celery.py 上定义一个 Celery 的实例。

文件 proj/proj/celery.py:

from __future__ import absolute_import, unicode_literals
import os
from celery import Celery

# set the default Django settings module for the 'celery' program.
os.environ.setdefault('DJANGO_SETTINGS_MODULE', 'proj.settings')

app = Celery('proj')

# Using a string here means the worker don't have to serialize
# the configuration object to child processes.
# - namespace='CELERY' means all celery-related configuration keys
#   should have a `CELERY_` prefix.
app.config_from_object('django.conf:settings', namespace='CELERY')

# Load task modules from all registered Django app configs.
app.autodiscover_tasks()


@app.task(bind=True)
def debug_task(self):
    print('Request: {0!r}'.format(self.request))

然后再在proj/proj/__init__.py做一些配置。

文件 proj/proj/__init__.py:

from __future__ import absolute_import, unicode_literals

# This will make sure the app is always imported when
# Django starts so that shared_task will use this app.
from .celery import app as celery_app

__all__ = ['celery_app']

完成上面的步骤之后，可以在命令行输入：

celery worker -A proj -l info

正常情况下，应该会出现类似于下图的输出。

开启 celery 并与 redis 连接

ok，接下来，为了让 celery 中执行的任务的结果返回我们的 Django，我们还应该安装 django-celery-results。

pip install django-celery-results

再在 proj/proj/settings.py: 中做如下的设置：

文件proj/proj/settings.py:

# Celery 设置
CELERY_BROKER_URL = 'redis://localhost:6379/0'
CELERY_ACCEPT_CONTENT = ['json']
CELERY_TASK_SERIALIZER = 'json'
CELERY_RESULT_BACKEND = 'django-db'
CELERY_TIMEZONE = 'Asia/Shanghai' 

INSTALLED_APPS = [
    ...
    ...
    'django_celery_results'
]

再 migrate 一下：

migrate django_celery_results

5. 加入一个耗时任务

在你的 app 的目录下，新建一个 tasks.py 文件。在里面加入一个耗时的任务：

from __future__ import absolute_import, unicode_literals
from celery import shared_task

# 模拟一个耗时操作
@shared_task
def longtime_test():
   ...
  # 在这里进行一些耗时操作
   ...

在 views.py 中,写成这样：

def test_view(request):
    # do something
    longtime_test.delay()
    return render(request, 'template.html', {'data': data})

这样之后，就会先返回 html 模版，再在后台计算数据了。

最后编辑于：2017.12.06 05:36:38

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 205,236评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,867评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,715评论 0赞 340
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,899评论 1赞 278
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,895评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,733评论 1赞 283
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,085评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,722评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,025评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,696评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,816评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,447评论 4赞 322
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,057评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,009评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,254评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,204评论 2赞 352
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,561评论 2赞 343