1、可迭代对象与迭代器对比
先举例
>>> s = 'pin'
>>> iter(s)
<str_iterator object at 0x1045752b0>
>>> iterator_s = iter(s)
>>> next(iterator_s)
'p'
>>> next(iterator_s)
'i'
>>> next(iterator_s)
'n'
>>> next(iterator_s)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
字符串对象就是一个可迭代的对象,通过iter函数可以获得它的迭代器并对字符串进行迭代。
再看定义
- 可迭代的对象:
使用iter内置函数可以获取迭代器的对象 - 迭代器:
迭代器对象实现了无参数的__next__
方法,返回序列中的下一个元素;如果没有元素了,就抛出StopIteration
异常。迭代器还实现了__iter__
方法,因此它本身也可以迭代。
也就是说,可迭代的对象有个__iter__
方法,每次都实例化一个新的迭代器;而迭代器要实现__next__
方法,返回单个元素,此外还要实现__iter__
方法,返回迭代器本身。
因此,迭代器可以迭代,但可迭代的对象不是迭代器。
另外,可迭代的对象一定不能是自身的迭代器,即可迭代对象必须实现__iter__
, 但一定不能实现__next__
方法;迭代器应该一直可以迭代,迭代器的__iter__
方法应该返回自身。
下面将实现可迭代的斐波那契数列对象和斐波那契数列迭代器
# 斐波那契数列可迭代对象
class Fibonacci:
def __init__(self, num):
self.num = num # 共有num个数字
def __iter__(self):
return FibonacciIterator(self.num)
# 斐波那契数列迭代器
class FibonacciIterator:
def __init__(self, num):
self.a = 0 # 第0个数是0
self.b = 1 # 第一个数是1
self.index = 1 # 从1开始
self.num = num # 共有num个数字
def __next__(self):
if self.index <= self.num:
temp = self.a
self.a, self.b = self.b, self.b + temp
self.index += 1
return self.a
raise StopIteration
def __iter__(self):
return self
print(iter(Fibonacci(5)))
# <__main__.FibonacciIterator object at 0x10c56be10>
print([i for i in iter(Fibonacci(5))])
# [1, 1, 2, 3, 5]
2、什么是生成器
- 生成器函数:生成器函数会创建一个生成器对象,包装生成器函数的定义体。把生成器传给next(...)函数时,生成器函数会向前,执行函数定义体中的下一个
yield
语句,返回产出的值,并在函数定义体中当前位置暂停。最终,函数的定义体返回时,外层的生成器对象会抛出StopIteration
异常------这一点与迭代器协议一致。
通俗一点讲,生成器函数和普通函数在句法的唯一区别就是,生成器函数在定义体中有yield
关键字。
关于yield
在函数体中具体产生了什么作用,看下面的例子
>>> def gen_AB():
... print("start")
... yield 'A'
... print("continue")
... yield 'B'
... print("end")
...
>>> gen_AB()
<generator object gen_AB at 0x1011b90f8>
>>> generator = gen_AB()
>>> next(generator)
start
'A'
>>> next(generator)
continue
'B'
>>> next(generator)
end
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
上面的例子中生成器对象可以和迭代器一样去迭代。
接着上面,讲下生成器表达式
[x*3 for x in gen_AB()]
start
continue
end
['AAA', 'BBB']
>>> res = (x*3 for x in gen_AB())
>>> res
<generator object <genexpr> at 0x1011b9200>
>>> for i in res:
... print('-->', i)
...
start
--> AAA
continue
--> BBB
end
列表推导迫切地迭代了gen_AB()函数生成地生成器对象产出地元素:'A'和'B',所以是先输出生成器函数中的打印语句。
使用生成表达式产生的是一个生成器对象,只有在迭代的时候,gen_AB()函数才会被真正执行。
最后
用生成器实现斐波那契数列可迭代对象
class Fibonacci:
def __init__(self, num):
self.a = 0 # 第0个数是0
self.b = 1 # 第一个数是1
self.index = 1 # 从1开始
self.num = num # 共有num个数字
def __iter__(self):
while self.index <= self.num:
temp = self.a
self.a, self.b = self.b, self.b + temp
self.index += 1
yield self.a
print(iter(Fibonacci(5)))
# <generator object Fibonacci.__iter__ at 0x10dc12258>
print(list(Fibonacci(5)))
# [1, 1, 2, 3, 5]
print([i for i in Fibonacci(5)])
# [1, 1, 2, 3, 5]
其实用斐波那契数列生成器的版本与迭代器的对比,可以发现,前者是iter函数返回一个迭代器对象,后者是返回生成器对象。两者迭代的方式是一致的,可以说生成器就是一种特殊的迭代器。