句法上看, 协程与生成器类似, 都是定义体中包含yield关键字的函数。
具体的协程的使用:
1.在协程中yield通常出现在表达式的右边,例如:datum = yield,可以产出值,也可以不产出--如果yield关键字后面没有表达式,那么生成器产出None.
2.协程可能从调用方接受数据,调用方是通过send(datum)的方式把数据提供给协程使用,而不是next(...)函数,通常调用方会把值推送给协程。
3.协程可以把控制器让给中心调度程序,从而激活其他的协程
协程的过程:
一个简单的例子:
上述例子中,yield 的右边没有表达式,所以这里默认产出的值是None。因为一开始生成器还没有启动,不会停在yield处,所以需要先调用next()函数。在激活了协程之后,程序就会运行到x = yield。当我们调用send方法后yield会收到这个值并赋值给x,而当程序运行到协程定义体的末尾时和用生成器的时候一样会抛出StopIteration异常。
协程在运行过程中有四个状态:
1.GEN_CREATE:等待开始执行
2.GEN_RUNNING:解释器正在执行,这个状态一般看不到
3.GEN_SUSPENDED:在yield表达式处暂停
4.GEN_CLOSED:执行结束
因为send方法的参数会成为暂停的yield表达式的值, 所以, 仅当协程处于暂停状态时才能调用send方法,例如sc.send('wolf')。不过,如果协程还没激活(即'GEN_CREATED'),情况就不同了。因此,始终要调用next(sc)激活协程——也可以调用sc.send(None), 效果一样。
最先调用next(sc)函数这一步通常称为“预激”(prime)协程(让协程向前执行到第一个yield表达式,准备好作为活跃的协程使用)。
通过以下的例子可以更全面了解协程在运行过程中的跳转与输出:
实例:使用协程计算平均值
上例是一个死循环,只要不断向协程中传值,就会一直计算平均值。
通过以上三个例子会发现,在使用协程的时候必须要通过next(...)方式激活协程,如果不预激,这个协程就无法使用。如果哪天在代码中遗忘了那么就出问题了,所以有一种预激协程的装饰器,可以帮助我们干这件事。
预激协程的装饰器
如上所示,在每个使用协程的地方调用装饰器,就能自动完成预激。很多框架都提供了处理协程的特殊装饰器,也就不需要我们来手动编写。比如我常用的Tornado框架中,就可以直接使用tornado.gen装饰器。
使用yield from句法调用协程时,会自动预激,因此与上述样例中@coroutine等装饰器不兼容,之后会具体讲述。
终止协程和异常处理
协程中未处理的异常会向上冒泡,传给next函数或send方法的调用方(即触发协程的对象)。比如我们在之前求平均值的例子中,不传数字而传字符串,就会有如下所示:
协程会如上所示抛出异常,并直接终止协程。如果尝试继续传入正确的数值,会抛出协程已终止的异常:
上例中暗示了终止协程的一种方式:发送某个哨符值,让协程退出。内置的None和Ellipsis等常量经常用作哨符值。Ellipsis的优点是,数据流中不太常有这个值。甚至可以把StopIteration类(类本身,而不是实例,也不抛出)作为哨符值;也就是说,是像这样使用的:ag.send(StopIteration)。
从python2.5开始客户端代码在生成器对象上调用两个方法,显示的把异常发送给协程:
分别为:throw和close
generator.throw:
会让生成器在暂停的yield表达式处抛出指定的异常,如果生成器处理了抛出的异常,代码会向前执行到下一个yield表达式,而产出的值会成为调用generator.throw方法代码的返回值。如果生成器没有处理抛出的异常,异常会向上冒泡,传到调用方的上下文中。
generator.close:
会让生成器在暂停的yield表达式处抛出GeneratorExit异常。如果生成器没有处理这个异常,或者抛出了StopIteration异常,调用方不会报错,如果收到GeneratorExit异常,生成器一定不能产出值,否则解释器会抛出RuntimeError异常。生成器抛出的异常会向上冒泡,传给调用方。
具体使用样例如下:
当传入我们定义的异常时不会影响协程,协程不会停止,可以继续send。但是如果是没有处理的异常的时候,就会报错,并且协程会被终止。
关于yield from
首先要知道,yield from是全新的语言结构。它的作用比yield多很多,因此人们认为继续使用那个关键字多少会引起误解。在其他语言中,类似的结构使用await关键字, 这个名称好多了, 因为它传达了至关重要的一点:在生成器gen中使用yield from subgen()时,subgen会获得控制权,把产出的值传给gen的调用方,即调用方可以直接控制subgen。与此同时,gen会阻塞,等待subgen终止。
yield from x表达式对x对象所做的第一件事是,调用iter(x),从中获取迭代器,因此x可以是任何可迭代的对象。
下面是一个yield from可以简化yield表达式的例子:
这两种的方式的结果是一样的,但是这样看来yield from更加简洁,但是yield from的作用可不仅仅是替代产出值的嵌套for循环。
yield from的主要功能是打开双向通道,把最外层的调用方与最内层的子生成器连接起来,这样二者可以直接发送和产出值,还可以直接传入异常,而不用再像之前那样在位于中间的协程中添加大量处理异常的代码。
因为yield语法需要在python3环境下使用,所以在此不再继续扩展,之后再接着说这块。