一文搞懂Python可迭代、迭代器和生成器的概念

关于我
一个有思想的程序猿,终身学习实践者,目前在一个创业团队任team lead,技术栈涉及Android、Python、Java和Go,这个也是我们团队的主要技术栈。
Github:https://github.com/hylinux1024
微信公众号:终身开发者(angrycode)

Python中可迭代(Iterable)、迭代器(Iterator)和生成器(Generator)这几个概念是经常用到的,初学时对这几个概念也是经常混淆,现在是时候把这几个概念搞清楚了。

0x00 可迭代(Iterable)

简单的说,一个对象(在Python里面一切都是对象)只要实现了只要实现了__iter__()方法,那么用isinstance()函数检查就是Iterable对象;

例如


class IterObj:



    def __iter__(self):

        # 这里简单地返回自身

        # 但实际情况可能不会这么写

        # 而是通过内置的可迭代对象来实现

        # 下文的列子中将会展示

        return self

上面定义了一个类IterObj并实现了__iter__()方法,这个就是一个可迭代(Iterable)对象


    it = IterObj()

    print(isinstance(it, Iterable))  # true

    print(isinstance(it, Iterator))  # false

    print(isinstance(it, Generator)) # false

记住这个类,下文我们还会看到这个类的定义。

常见的可迭代对象

Python中有哪些常见的可迭代对象呢?

  1. 集合或序列类型(如listtuplesetdictstr

  2. 文件对象

  3. 在类中定义了__iter__()方法的对象,可以被认为是 Iterable对象,但自定义的可迭代对象要能在for循环中正确使用,就需要保证__iter__()实现必须是正确的(即可以通过内置iter()函数转成Iterator对象。关于Iterator下文还会说明,这里留下一个坑,只是记住iter()函数是能够将一个可迭代对象转成迭代器对象,然后在for中使用)

  4. 在类中实现了如果只实现__getitem__()的对象可以通过iter()函数转化成迭代器但其本身不是可迭代对象。所以当一个对象能够在for循环中运行,但不一定是Iterable对象。

关于第1、2点我们可以通过以下来验证


    print(isinstance([], Iterable))  # true list 是可迭代的

    print(isinstance({}, Iterable))  # true 字典是可迭代的

    print(isinstance((), Iterable))  # true 元组是可迭代的

    print(isinstance(set(), Iterable))  # true set是可迭代的

    print(isinstance('', Iterable))  # true 字符串是可迭代的



    currPath = os.path.dirname(os.path.abspath(__file__))

    with open(currPath+'/model.py') as file:

        print(isinstance(file, Iterable)) # true

我们再来看第3点


    print(hasattr([], "__iter__")) # true

    print(hasattr({}, "__iter__")) # true

    print(hasattr((), "__iter__")) # true

    print(hasattr('', "__iter__")) # true

这些内置集合或序列对象都有__iter__属性,即他们都实现了同名方法。但这个可迭代对象要在for循环中被使用,那么它就应该能够被内置的iter()函数调用并转化成Iterator对象。

例如,我们看内置的可迭代对象


    print(iter([])) # <list_iterator object at 0x110243f28>

    print(iter({})) # <dict_keyiterator object at 0x110234408>

    print(iter(())) # <tuple_iterator object at 0x110243f28>

    print(iter('')) # <str_iterator object at 0x110243f28>

它们都相应的转成了对应的迭代器(Iterator)对象。

现在回过头再看看一开始定义的那个IterObj


class IterObj:



    def __iter__(self):

        return self



it = IterObj()

print(iter(it))

我们使用了iter()函数,这时候将再控制台上打印出以下信息:


Traceback (most recent call last):

  File "/Users/mac/PycharmProjects/iterable_iterator_generator.py", line 71, in <module>

    print(iter(it))

TypeError: iter() returned non-iterator of type 'IterObj'

出现了类型错误,意思是iter()函数不能将‘非迭代器’类型转成迭代器。

那如何才能将一个可迭代(Iterable)对象转成迭代器(Iterator)对象呢?

我们修改一下IterObj类的定义


class IterObj:

    def __init__(self):

        self.a = [3, 5, 7, 11, 13, 17, 19]

    def __iter__(self):

        return iter(self.a)

我们在构造方法中定义了一个名为a的列表,然后还实现了__iter__()方法。

修改后的类是可以被iter()函数调用的,即也可以在for循环中使用


    it = IterObj()

    print(isinstance(it, Iterable)) # true

    print(isinstance(it, Iterator)) # false

    print(isinstance(it, Generator)) # false

    print(iter(it)) # <list_iterator object at 0x102007278>

    for i in it:

        print(i) # 将打印3、5、7、11、13、17、19元素

因此在定义一个可迭代对象时,我们要非常注意__iter__()方法的内部实现逻辑,一般情况下,是通过一些已知的可迭代对象(例如,上文提到的集合、序列、文件等或其他正确定义的可迭代对象)来辅助我们来实现

关于第4点说明的意思是iter()函数可以将一个实现了__getitem__()方法的对象转成迭代器对象,也可以在for循环中使用,但是如果用isinstance()方法来检测时,它不是一个可迭代对象。


class IterObj:



    def __init__(self):

        self.a = [3, 5, 7, 11, 13, 17, 19]



    def __getitem__(self, i):

        return self.a[i]



it = IterObj()

print(isinstance(it, Iterable)) # false

print(isinstance(it, Iterator)) # false

print(isinstance(it, Generator)) false

print(hasattr(it, "__iter__")) # false

print(iter(it)) # <iterator object at 0x10b231278>

for i in it:

    print(i) # 将打印出3、5、7、11、13、17、19

这个例子说明了可以for中使用的对象,不一定是可迭代对象。

现在我们做个小结:

  1. 一个可迭代的对象是实现了__iter__()方法的对象

  2. 它要在for循环中使用,就必须满足iter()的调用(即调用这个函数不会出错,能够正确转成一个Iterator对象)

  3. 可以通过已知的可迭代对象来辅助实现我们自定义的可迭代对象。

  4. 一个对象实现了__getitem__()方法可以通过iter()函数转成Iterator,即可以在for循环中使用,但它不是一个可迭代对象(可用isinstance方法检测())

0x01 迭代器(Iterator)

上文很多地方都提到了Iterator,现在我们把这个坑填上。

当我们对可迭代的概念了解后,对于迭代器就比较好理解了。

一个对象实现了__iter__()__next__()方法,那么它就是一个迭代器对象。 例如


class IterObj:

    def __init__(self):

        self.a = [3, 5, 7, 11, 13, 17, 19]

        self.n = len(self.a)

        self.i = 0

    def __iter__(self):

        return iter(self.a)

    def __next__(self):

        while self.i < self.n:

            v = self.a[self.i]

            self.i += 1

            return v

        else:

            self.i = 0

            raise StopIteration()

IterObj中,构造函数中定义了一个列表a,列表长度n,索引i


    it = IterObj()

    print(isinstance(it, Iterable)) # true

    print(isinstance(it, Iterator)) # true

    print(isinstance(it, Generator)) # false

    print(hasattr(it, "__iter__")) # true

    print(hasattr(it, "__next__")) # true

我们可以发现上文提到的

集合和序列对象是可迭代的但不是迭代器


    print(isinstance([], Iterator)) # false

    print(isinstance({}, Iterator)) # false

    print(isinstance((), Iterator)) # false

    print(isinstance(set(), Iterator)) # false

    print(isinstance('', Iterator)) # false

文件对象是迭代器


    currPath = os.path.dirname(os.path.abspath(__file__))

    with open(currPath+'/model.py') as file:

        print(isinstance(file, Iterator)) # true

一个迭代器(Iterator)对象不仅可以在for循环中使用,还可以通过内置函数next()函数进行调用。 例如


it = IterObj()

next(it) # 3

next(it) # 5

0x02 生成器(Generator)

现在我们来看看什么是生成器?

一个生成器既是可迭代的也是迭代器

定义生成器有两种方式:

  1. 列表生成器

  2. 使用yield定义生成器函数

先看第1种情况


    g = (x * 2 for x in range(10)) # 0~18的偶数生成器

    print(isinstance(g, Iterable)) # true

    print(isinstance(g, Iterator)) # true

    print(isinstance(g, Generator)) # true

    print(hasattr(g, "__iter__")) # true

    print(hasattr(g, "__next__")) # true

    print(next(g)) # 0

    print(next(g)) # 2

列表生成器可以不需要消耗大量的内存来生成一个巨大的列表,只有在需要数据的时候才会进行计算。

再看第2种情况


def gen():

    for i in range(10):

        yield i

这里yield的作用就相当于return,这个函数就是顺序地返回[0,10)的之间的自然数,可以通过next()或使用for循环来遍历。

当程序遇到yield关键字时,这个生成器函数就返回了,直到再次执行了next()函数,它就会从上次函数返回的执行点继续执行,即yield退出时保存了函数执行的位置、变量等信息,再次执行时,就从这个yield退出的地方继续往下执行。

Python中利用生成器的这些特点可以实现协程。协程可以理解为一个轻量级的线程,它相对于线程处理高并发场景有很多优势。

看下面一个用协程实现的生产者-消费者模型


def producer(c):

    n = 0

    while n < 5:

        n += 1

        print('producer {}'.format(n))

        r = c.send(n)

        print('consumer return {}'.format(r))

def consumer():

    r = ''

    while True:

        n = yield r

        if not n:

            return

        print('consumer {} '.format(n))

        r = 'ok'

if __name__ == '__main__':

    c = consumer()

    next(c)  # 启动consumer

    producer(c)

这段代码执行效果如下


producer 1

consumer 1

producer return ok

producer 2

consumer 2

producer return ok

producer 3

consumer 3

producer return ok

协程实现了CPU在两个函数之间进行切换从而实现并发的效果。

0x04 引用

  1. https://docs.python.org/3.7/
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,997评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,603评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,359评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,309评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,346评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,258评论 1 300
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,122评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,970评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,403评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,596评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,769评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,464评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,075评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,705评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,848评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,831评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,678评论 2 354

推荐阅读更多精彩内容