1.什么是迭代
在Python中,如果给定一个list
或tuple
,我们可以通过for
循环来遍历这个list
或tuple
,这种遍历我们成为迭代(Iteration)
。
在Python中,迭代是通过 for ... in
来完成的,而很多语言比如C或者Java,迭代list是通过下标完成的,比如Java代码:
for (i=0; i<list.length; i++) {
n = list[i];
}
可以看出,Python的for
循环抽象程度要高于Java的for
循环。
因为 Python 的 for
循环不仅可以用在list
或tuple
上,还可以作用在其他任何可迭代对象上。
因此,迭代操作就是对于一个集合,无论该集合是有序还是无序,我们用 for
循环总是可以依次取出集合的每一个元素。
注意: 集合是指包含一组元素的数据结构,我们已经介绍的包括:
- 有序集合:
list
,tuple
,str
和unicode
; - 无序集合:
set
- 无序集合并且具有
key-value
对:dict
而迭代是一个动词,它指的是一种操作,在Python中,就是for
循环。
迭代与按下标访问数组最大的不同是,后者是一种具体的迭代实现方式,而前者只关心迭代结果,根本不关心迭代内部是如何实现的。
2.索引迭代
Python中,迭代永远是取出元素本身,而非元素的索引。
对于有序集合,元素确实是有索引的。有的时候,我们确实想在 for
循环中拿到索引,怎么办?
方法是使用 enumerate()
函数:
>>> L = ['Adam', 'Lisa', 'Bart', 'Paul']
>>> for index, name in enumerate(L):
... print index, '-', name
...
0 - Adam
1 - Lisa
2 - Bart
3 - Paul
使用 enumerate()
函数,我们可以在for
循环中同时绑定索引index
和元素name
。但是,这不是 enumerate()
的特殊语法。实际上,enumerate()
函数把:
['Adam', 'Lisa', 'Bart', 'Paul']
变成了类似:
[(0, 'Adam'), (1, 'Lisa'), (2, 'Bart'), (3, 'Paul')]
因此,迭代的每一个元素实际上是一个tuple
:
for t in enumerate(L):
index = t[0]
name = t[1]
print index, '-', name
如果我们知道每个tuple
元素都包含两个元素,fo
r循环又可以进一步简写为:
for index, name in enumerate(L):
print index, '-', name
这样不但代码更简单,而且还少了两条赋值语句。
可见,索引迭代也不是真的按索引访问,而是由 enumerate()
函数自动把每个元素变成 (index, element)
这样的tuple
,再迭代,就同时获得了索引和元素本身。
3.迭代dict
的value
我们已经了解了dict
对象本身就是可迭代对象,用 for
循环直接迭代 dict
,可以每次拿到dict
的一个key
。
如果我们希望迭代 dict
对象的value
,应该怎么做?
dict
对象有一个 values()
方法,这个方法把dict
转换成一个包含所有value
的list
,这样,我们迭代的就是 dict
的每一个 value
:
d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }
print d.values()
# [85, 95, 59]
for v in d.values():
print v
# 85
# 95
# 59
如果仔细阅读Python的文档,还可以发现,dict
除了values()
方法外,还有一个 itervalues()
方法,用 itervalues()
方法替代 values()
方法,迭代效果完全一样:
d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }
print d.itervalues()
# <dictionary-valueiterator object at 0x106adbb50>
for v in d.itervalues():
print v
# 85
# 95
# 59
那这两个方法有何不同之处呢?
values()
方法实际上把一个dict
转换成了包含value
的list
。但是
itervalues()
方法不会转换,它会在迭代过程中依次从dict
中取出value
,所以itervalues()
方法比values()
方法节省了生成list
所需的内存。打印
itervalues()
发现它返回一个<dictionary-valueiterator>
对象,这说明在Python中,for
循环可作用的迭代对象远不止list
,tuple
,str
,unicode
,dict
等,任何可迭代对象都可以作用于for
循环,而内部如何迭代我们通常并不用关心。
如果一个对象说自己可迭代,那我们就直接用 for
循环去迭代它,可见,迭代是一种抽象的数据操作,它不对迭代对象内部的数据有任何要求。
4.迭代dict
的key
和value
我们了解了如何迭代 dict
的key
和value
,那么,在一个 for
循环中,能否同时迭代key
和value
?答案是肯定的。
首先,我们看看 dict
对象的 items()
方法返回的值:
>>> d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }
>>> print d.items()
[('Lisa', 85), ('Adam', 95), ('Bart', 59)]
可以看到,items()
方法把dict
对象转换成了包含tuple
的list
,我们对这个list
进行迭代,可以同时获得key
和value
:
>>> for key, value in d.items():
... print key, ':', value
...
Lisa : 85
Adam : 95
Bart : 59
和 values()
有一个 itervalues()
类似,items()
也有一个对应的 iteritems()
,iteritems()
不把dict
转换成list
,而是在迭代过程中不断给出tuple
,所以, iteritems()
不占用额外的内存。