三、Celery 进阶

Celery 进阶

前面已经对Celery的简单使用和配置做了介绍,本章将会展示Celery的更多细节

  • 在自己的应用中使用Celery
  • 任务调用
  • Canvas:设计任务流
  • 路由
  • 远程控制
  • 时区
  • 最优化

在自己的应用中使用Celery

我们的项目

项目目录:

proj/__init__.py
    /celery.py
    /tasks.py

pro/celery.py

from __future__ import absolute_import, unicode_literals
from celery import Celery

app = Celery('proj',
            broker = 'amqp://',
            backend = 'amqp://',
            include = ['proj.tasks'])

app.conf.update(
    result_expires = 3600
)

if __name__ == '__main__':
    app.start()

在这个模块中创建了Celery实例(通常称为app

要在项目中使用Celery只需要通过import导入该实例就行了

  • broker参数指定要使用的中间件的URL
  • backend参数指定使用的result backend

    用来跟踪任务状态和结果,虽然默认状态下结果不可用。以上例子中使用RPC result backend。当然,不同的result backend都有自己的好处和坏处,根据自己实际情况进行选择,如果不需要最好禁用。通过设置@task(ignore_result=True)选项来禁用耽搁任务)

  • include参数是当worker启动时导入的模块列表需要在这里添加自己的任务莫夸这样worker就可以找到任务

proj/tasks.py

from __future__ import absolute_import, unicode_literals
from .celery import app

@app.task
def add(x, y):
    return x + y

@app.task
def mul(x, y):
    return x * y
    
@app.task
def xsum(numbers):
    return sum(numbers)

启动worker

Celery程序可以用来启动worker

celery -A proj worker -l info
 -------------- celery@centos6 v4.1.0 (latentcall)
---- **** ----- 
--- * ***  * -- Linux-2.6.32-696.el6.x86_64-x86_64-with-centos-6.9-Final 2018-03-26 12:27:49
-- * - **** --- 
- ** ---------- [config]
- ** ---------- .> app:         task:0x7fe5cfbd20d0
- ** ---------- .> transport:   amqp://guest:**@localhost:5672//
- ** ---------- .> results:     amqp://
- *** --- * --- .> concurrency: 4 (prefork)
-- ******* ---- .> task events: OFF (enable -E to monitor tasks in this worker)
--- ***** ----- 
 -------------- [queues]
                .> celery           exchange=celery(direct) key=celery
                
[tasks]

[2018-03-26 12:27:49,921: INFO/MainProcess] Connected to amqp://guest:**@localhost:5672//
[2018-03-26 12:27:49,926: INFO/MainProcess] mingle: searching for neighbors
[2018-03-26 12:27:49,499: INFO/MainProcess] mingle: sync with 1 nodes
[2018-03-26 12:27:50,950: INFO/MainProcess] mingle: sync complete
[2018-03-26 12:27:50,957: INFO/MainProcess] celery@centos6 ready.
  • broker是在celery模块中指定的中间件参数的url,也可以在命令行中通过-b选项指定不同的中间件
  • Concurrent是用于并行处理的任务的预创建worker进程数量,当所有的任务都在忙于工作时,新的任务必须等待之前的执行完成才能处理

默认的并发数是机器上CPU的数量,可以通过celery worker -c选项指定自定义数量。没有推荐值,最佳数量取决于很多因素,但是如果你的任务主要是I/O相关的,就可以增加这个数量。实验表明,增加超过两倍CPU数量效果很差,而且可能会降低性能

除了prefork poolCelery还支持EventletGevent并且还能在单线程上运行

  • Event是一个可选项,当启用的时候,Celery会发送监控(消息)来反映worker的操作,也可以被用来监视像celeryeventsFlower(实时Celery监控)这样的程序。
  • Queuesworker将使用的任务的队列的集合,worker可以一次接受几个队列,它用来将消息路由到特定的工作者以作为服务质量、关注点分离、和优化的一种方式

可以通过命令行获取完整的列表————celery worker --help

停止worker

ctrl-c

后台

生产环境中一般将worker放到后台,后台脚本使用celery multi命令后台启动一个或多个worker

celery multi start w1 -A proj -l info

控制台打印

celery multi v4.1.0 (latentcall)
> Starting nodes...
        > w1@centos6: OK
Stale pidfile exists - Removing it.

也可以重启:

celery multi restart w1 -A proj -l info
celery multi v4.1.0 (latentcall)
> Stopping nodes...
        > w1@centos6: TERM -> 23620
> Waiting for 1 node -> 23620.....
        > w1@centos6: OK
> Restarting node w1@centos6: OK
> Waiting for 1 node -> None...

停止:

celery multi stop w1 -A proj -l info

stop命令是异步的所以它不会等待worker关闭,可以使用stopwait命令来确保当前执行都任务在退出前都已执行完毕

celery multi stopwait w1 -A proj -l info

celery multi不会存储关于worker的信息,所以重启的时候需要使用同样的命令行参数。在停止时,必须使用相同的pidfilelogfile参数

默认情况下,程序将在当期目录创建pidlog文件,为了防止多个worker运行出错,推荐将这些文件放在专门的目录:

mkdir -p /var/run/celery
mkdir -p /var/log/celery
celery multi start w1 -A proj -l info --pidfile=/var/run/celery/%n.pid --logfile=/var/log/celery/%n%I.log

使用multi指令可以启动多个worker,并且有一个强大的命令行语法来为不同的worker指定参数:

celery multi start 10 -A proj -l info -Q:1-3 images, video -Q:4, 5 data -Q default -L:4,5 debug

~Detail about multi temp

--app参数

--app参数指定使用的Celery应用实例,必须以module.path:attribute的形式出现

但也支持快捷方式,只要包名指定了,就会尝试在应用实例中搜索

使用--app=proj

  1. 名为proj.app的属性
  2. 名为proj.app的属性
  3. 模块proj中的任何属性都是一个Celery应用程序,如果都没有发现,它就会尝试一个名为proj.celery的子模块
  4. 名为proj.celery.app的属性
  5. 名为proj.celery.celery的属性
  6. 模块proj.celery中的任何属性都是一个Celery应用程序

任务调用

  • 可以通过使用delay()方法来调用一个任务
add.delay(3, 3)

这个方法实际上是另一种叫做apply_async()方法的快捷方式

add.applay_async((3, 3))

后者(applay_async())能够指定执行选项,比如运行时间(倒计时)、应该发送的队列等等:

add.apply_async((2, 2), queue='lopri', countdown=10)

上述案例中,任务会被发送给一个名为lopri的队列,该任务会在信息发送后十秒执行

直接应用该任务会在当前进程中执行任务,不会发送消息

add(3, 3)

result:6

三种方法delay()apply_async()和应用__call__,代表了Celery调用API,也同样用于签名

  • 每一个任务调用都有一个唯一的标识符(UUID),这个就是任务的id

  • delay()apply_async方法会返回一个AsyncResult实例,可以被用来跟踪任务执行状态,但是需要开启result backend这样状态才能被存储在某处

  • Results默认是禁用的,因为实际上没有一个result backend适用于每个应用程序,所以要考虑到每个独立backend的缺点来选择一个使用。对于许多保持返回值的任务来说都不是很有用,所以这个默认的禁用是很明智的。还需要注意的是,result backend并不用来监控任务和worker,对于Celery有专门的事件消息

如果配置了result backend就可以接收到任务的返回值

result = add.delay(2, 2)
res.get(timeout=1)

retult:4

  • 可以通过查看id属性找到任务的id
res.id

result:073c568d-ca88-4198-b735-0f98f861218b

  • 如果任务抛出异常也可以检查到异常,默认result.get()可以传播任何错误

  • 如果不希望错误传播,可以通过propagete属性禁用

res.get(propagate=False)

在这种情况下,它会返回所提出的异常实例,以便检查任务是否成功或失败,您将不得不在结果实例上使用相应的方法

res.failed()
res.successful()

也可以通过state找到任务的状态

res.state

result:FAILUTE

  • 一个任务只能有一个状态,但是可以在几个状态中发展,典型任务阶段可能是这样
PENDING -> STARTED -> SUCCESS

STARTED状态是一个特殊的状态,只有在task_track_started设置启用或者@task(track_started=True)选项设置的时候才会被记录下来

PENDING状态实际上不是记录状态,而是未知任务id的默认状态

from proj.celery import app
res = app.AsyncResult('this-id-does-not-exist')
res.state

result:PENDING

  • 如果重新尝试这个任务可能会变得更复杂,对于一个尝试过两遍的任务来说阶段可能是这样:
PENDING -> STARTED -> RETRY -> STARTED -> RETRY -> STARTED -> SUCCESS

Canvas:设计任务流

前面学习了通过delay方法调用任务,通常这样就够了,但是有时可能需要将任务调用的签名传递给另一个进程或者另一个函数的参数,对Celery来说叫做signatures

签名以某种方式包装了单一任务调用的参数和执行选项,以便将其传递给函数,甚至序列化后发送。

可以使用参数(2, 2)和十秒的计时器来为add任务创建一个签名

add.signature((2, 2), countdown=10)

也可以简写:

add.s(2, 2)

调用API

签名的实例也支持调用API,意味着也可以有delayapply_async方法

但是有一个区别,那就是签名可能已经指定了一个参数签名,add任务接受两个参数,所以一个制定了两个参数的签名将会形成一个完整的签名

s1 = add.s(2, 2)
res = s1.delay()
res.get()

也可以使用不完成的签名,叫做partials

s1 = add.s(2)

s2现在是部分签名,需要另一个参数才完整,则可以在调用signature的时候处理

# resolves the partial: add(8, 2)
res = s2.delay(8)
res.get()

在这里,添加了参数8,对已存在的参数2组成了一个完整的签名add(8, 2)

关键字参数也可以延迟添加,会和已存在的关键字参数合并,新参数优先(新参数覆盖旧参数)

s3 = add.s(2, 2, debug=True)
s3.delay(debug=False)

已声明的签名支持调用API:

  • sig.apply_async(arg=(), kwargs={}, **options
    使用可选部分参数和部分关键字参数调用签名,也支持部分可执行选项
  • sig.delay(*args, **kwargs)
    apply_async的星参版本,任何参数都会被预先记录在签名的参数你,关键字参数会和现有的keys合并

基本体

  • group
  • chain
  • chord
  • map
  • starmap
  • chunks

这些基本体本身就是签名对象,因此,它们可以以任何多种方式组合起来组成复杂的工作流

Group

一个group同时调用任务列表,返回一个特殊结果实例,这样可以以组的形式检查结果,并按顺序检索返回值

from celery import group
from proj.tasks import add

group(add.s(i, i) for in in xrange(10))().get()

result:[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]

  • Partial group
g = group(add.s(i, i) for i in xrange(10))
g(10).get()

result:[10, 11, 12, 13, 14, 15, 16, 17, 18, 19]

Chains

任务可以被相互连接起来,这样在一个任务返回后另一个任务被调用

from celery import chain
form proj.tasks import add, mul

// 用法1
chian(add.s(4, 4) | mul.s(8))().get()

// 用法2
g = chain(add.s(4) | mul.s(8))
g(4).get()

// 用法3
(add.s(4, 4) | mul.s(8))().get()

Chords

chord是一个有返回值的group

from celery import chord
from proj.tasks import add, xsum

// 用法1
(group(add.s(i, i) for i in xrange(10)) | xsum.s())().get()

// 用法2
upload_document.s(file) | group(apply_filter.s() for filter in filters)

路由

Celery支持AMQP提供的所有路由设施,但是它也支持简单路由,将消息发送到指定的队列

task_routes设置可以是用户按名称对任务进行路由,并将一切集中在一个位置

app.conf.update{
    task_routes = {
        'proj.tasks.add': {'queue': 'hipri'},
    }
}

可以在运行时通过queue参数指定队列到apply_async

from proj.tasks import add
add.apply_async((2,2), queue='hipri')

然后可以通过指定celery worker -Q选项使worker从队列中消费

celery -A proj worker -Q hipri

也可以通过使用逗号分隔符(,)来指定多个队列

celery -A proj worker -Q hipri, celery

默认队列因为历史原因命名为:celery

队列的顺序无关紧要,因为worker会给队列相同的权重

远程控制

如果使用RabbitMQ(AMQP)Redis或者Qpid作为中间件就可以在运行时监视worker

  • 查看worker当前执行的任务
celery -A proj inspect active

这是通过使用广播消息实现的,因此,急群众的每一个工作人员都能接收到所有远程控制命令

  • 也可以指令一个或多个worker使用--destination选项请求行动,这是一个逗号分隔的worker主机名列表
celery -A proj inspect active --destination=celery@example.com

如果没有提供目标,那么每个worker都会对请求做出反应并回复

  • celery inspect命令包含的命令不会改变worker的任何东西,它只会回复关于worker内部发生的事情的信息和统计信息,可以执行命令检查列表:
celery -A proj inspect --help
  • celery control命令,包含在运行时实际改变worker操作的命令
celery -A proj control --help
  • 强制worker启用事件消息(用于监视任务和工作人员)
celery -A proj control enable_events

当事件激活,可以启动event dumper查看worker正在做什么

celery -A proj events --dump

或者

celery -A proj events

当完成监控可以再次禁用events

celery -A proj control disable_events

celery status命令还能使用远程控制命令,并显示集群中的在线worker列表

celery -A proj status

时区

所有的时间和日期、内部和消息多使用UTC时间区域

worker收到消息,例如使用倒计时设置,它将UTC时间转换为本地时间。如果希望使用与系统时区不同的地区,那么必须要使用时区设置来配置该时区:

app.conf.timezone = 'Asia/Shanghai'

最优化

默认的配置并没有针对吞吐量进行优化,它试图在许多短任务和更少的长任务之间走中间路线,这是吞吐量和公平调度之间的折中

如果正在使用RabbitMQ,那么可以安装librabbitmq模块,这是一个用C语言实现的AMQP客户端

pip install librabbitmq
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,123评论 6 490
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,031评论 2 384
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,723评论 0 345
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,357评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,412评论 5 384
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,760评论 1 289
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,904评论 3 405
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,672评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,118评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,456评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,599评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,264评论 4 328
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,857评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,731评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,956评论 1 264
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,286评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,465评论 2 348

推荐阅读更多精彩内容

  • 早上五点半起床,家人都还在睡觉,匆匆忙打了卡,发了每日需要完成的任务之后,我选择睡个回笼觉,刚开始躺在床上的时...
    兰欣生命之旅阅读 192评论 0 0
  • 在超市发现了你爱喝的巧克力味椰子水 开心的买了一个回来 思考要不要送去给你 有点紧张 焦虑地揉搓着包装 你会收么 ...
    苏三写诗阅读 142评论 0 0
  • 容错性是一个非常重要的概念,比如说disk里的东西丢了有没有什么办法恢复呢?有几种办法。 比如说同样的数据存在好几...
    98Future阅读 374评论 0 0
  • 今晚感觉特别疲惫。聚餐到最后甚至都有点懒得笑了。 昨晚见到很久没见的V,半夜两个人坐在居酒屋里吃的串烧,喝着梅酒,...
    小肉丸子阅读 253评论 3 3