迭代器和生成器是python面试的时候,被问概率较高的一个知识点,很多小伙伴都不太分得清这两者的区别,今天就来给大家详细的讲解迭代器和生成器的区别。
一、可迭代对象
再讲解迭代器和生成器之前,我们得先说说可迭代对象,所谓的可迭代对象就是能够通过for循环迭代,逐一返回其成员项的对象称为可迭代对象, python中可迭代对象包括
-
1、所有序列类型 :如
list
、str
和tuple
、range
-
2、非序列类型:
dict
、set
、文件对象
-
3、实现了
__iter__()
方法的任意对象 -
4、实现了序列语义的
__getitem__()
方法的任意对象。
二、for循环迭代到底干了啥?
1、 __iter__()
方法
__iter__()
在python中也被称作迭代协议,只要对象拥有 __iter__()
方法,那么该对象就实现了迭代协议,就可以进行迭代操作。
另外 __iter__()
方法的返回值,必须是一个迭代器(迭代器下章详细讲解)。
python中的list、str、tuple、dict、set等类型都实现了 __iter__()
(迭代协议),所以能够直接进行遍历。
当我们用for去遍历任何一个对象时,for循环执行的时候,会先去调用对象的 __iter__()
,根据__iter__()
返回的迭代器,再进行迭代操作。
下面是我自己定义的一个实现__iter__()
方法,可迭代对象的类
class MyArray:
"""自定义的可迭代对象类"""
def __iter__(self):
return iter([11, 22, 33, 44])
if __name__ == '__main__':
m = MyArray()
for i in m:
print(i)
执行结果:
11
22
33
44
上面案例遍历自定义MyArray类的对象,可以看到遍历出来的是 __iter__()
返回迭代器中的数据
2、__getitem__()
方法
__getitem__()
是用来实现序列类型数据索引取值的魔术方法。python中的str、list、dict等类型的数据均实现了该方法。
li = [11,22,33]
dic = {'a':11,'b':22}
# 列表索引取值,本质上调用的是 li.__getitem__(1)方法去取值的。
li[1]
前面说到for循环遍历对象的时候,会先去调用对象的 __iter__()
方法,如果对象没有定义 __iter__()
方法,那么for在遍历的时候,就会从索引 0 开始,循环调用__getitem__()
,,把__getitem__()
的返回值,作为遍历出来的数据,直到__getitem__()
中抛出异常,则终止循环。
下面是通过__getitem__()
方法实现的可迭代对象的类。
class Mylist2:
"""自定义的序列类类"""
li = ['a1', 'a2', 'a3', 'a4']
def __getitem__(self, item):
# iten是for循环内部传进来的索引值,从0开始
return self.li[item]
if __name__ == '__main__':
m2 = Mylist2()
for i in m2:
print(i)
执行结果:
a1
a2
a3
a4
从上面的案例中我们可以看到我们在遍历Mylist2这个类的对象时,其实就是不断的调用对象的__getitem__
方法来获取遍历出来的值。
二、迭代器(Iterator)
理解了什么是可迭代对象和for循环迭代的机制之后,我们再来了解一下迭代器协议和迭代器。
3.1、迭代器协议:
迭代器协议由一个`__iter__` 方法和__next__方法共同构成。实现了这两个方法的对象就实现了迭代器协议。
-
1、对象实现了迭代协议的对象(实现了
__iter__
方法) -
2、对象实现了
__next__
方法,__next__
方法在迭代完所有数据之后,会抛出StopIteration
的错误信息。
3.2、迭代器
-
1、实现了迭代器协议的对象,就是一个迭代器
-
2、所有的可迭代对象 都可以通过内置函数iter()转换为迭代器:
-
3、迭代器对象能够使用 内置函数next 进行迭代操作,当所有数据迭代完毕后,再使用next迭代,会抛出异常StopIteration。
-
4、所有的迭代器都是可迭代对象,因为迭代器协议包含了迭代协议
# 将列表转换为一个迭代器 iter_li = iter([11,22,33,44]) # 通过next对迭代器进行迭代操作,每次可以迭代出来一个数据 s1 = next(iter_li) print('s1:',s1) s2 = next(iter_li) print('s2:',s2) # 上述代码运行结果为: s1 :11 s2 :22
三、生成器
问题:什么是生成器?生成器有什么作用?
是一种特殊的迭代器,具备迭代器所有的特性,生成器内部不存储数据,只保存生成数据的计算规则,在存储大量数据的时候,能够节约内存的开销
python中定义生成器,一共有两种方式,一种是生成器表达式,另一种是生成器函数。
4.1、生成器表达式
生成器表达式的语法其实就是把列表推导式的中括号改成小括号,如下:
gen_ =(item for item in range(10))
print(gen_)
运行结果:
<generator object <genexpr> at 0x00000000023A8DB0>
上面运行的结果是一个generator object,就是一个生成器对象,而上面写的表达式,就叫做生成器表达式
4.2、生成器函数
在函数中使用yeild关键字可以定义一个生成器函数。只要当函数中有yeild这个关键字,那么就不能再把它看成一个简单的函数,调用函数不会直接执行函数内部的代码,而是直接返回的就是一个生成器对象
def func():
for i in item:
yeild i
#调用函数
gen_lsit = func()
print(type(gen_list))
#返回的是一个generator对象
#同样也可以使用next生成数据
next(gen_list)
四、生成器和迭代器的区别:
生成器属于迭代器的一种,如何区分迭代器和生成器?
-
1、迭代器类型是Iterator类型,生成器是Generator类型。
-
2、生成器内部不存储数据,只保存生成数据的计算规则
-
3、生成器比迭代器多了3个方法
-
send方法:在生成数据的同时,可以和生成器内部进行数据交互
-
close: 生成可以调用close方法进行关闭
-
throw: 可以在生成器内部上一次暂停的yield处引发一个指定的异常类型。生成器内部可以通过捕获的异常类型来做不同的处理
-
def gen():
for i in range(10):
yield i
g = gen()
print(next(g))
print(g.send(10))
# close:关闭生成器
# g.close()
# throw :在生成器内部主动引发一个异常 参数:异常类型 异常信息
# g.throw(ValueError, "hello python")
欢迎来到testingpai.com!
注册 关于