本文是廖雪峰教程的笔记。
字典dict
Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度。dict的例子d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}
,用大括号表示。
和list比较,dict有以下几个特点:
- 查找和插入的速度极快,不会随着key的增加而变慢;
- 需要占用大量的内存,内存浪费多。
而list相反:
- 查找和插入的时间随着元素的增加而增加;
- 占用空间小,浪费内存很少。
所以,dict是用空间来换取时间的一种方法。
正确使用dict非常重要,需要牢记的第一条就是dict的key必须是不可变对象。
这是因为dict根据key来计算value的存储位置,如果每次计算相同的key得出的结果不同,那dict内部就完全混乱了。这个通过key计算位置的算法称为哈希算法(Hash)。
要保证hash的正确性,作为key的对象就不能变。在Python中,字符串、整数等都是不可变的,因此,可以放心地作为key。而list是可变的,就不能作为key。选择不可变对象作为key很重要,最常用的key是字符串。
集合set
- set和dict类似,也是一组key的集合,但不存储value。
- set可以看成数学意义上的无序和无重复元素的集合,因此,两个set可以做数学意义上的交集、并集等操作。
- 要创建一个set,需要提供一个list作为输入集合,例如:
s = set([1, 2, 3])
。注意,传入的参数[1, 2, 3]
是一个list,而显示的{1, 2, 3}
只是告诉你这个set内部有1,2,3这3个元素,显示的顺序也不表示set是有序的。简而言之可以认为set的写法是小括号里面套一个中括号,([..,..])
- set和dict的唯一区别仅在于没有存储对应的value,但是,set的原理和dict一样,所以,同样不可以放入可变对象。
- str是不可变对象,下面的代码给出了一个例子:
>>> a = 'abc'
>>> a.replace('a', 'A')
'Abc'
>>> a
'abc'
变量a的数据类型是str。当我们调用a.replace('a', 'A')
时,实际上调用方法replace
是作用在字符串对象'abc'
上的,而这个方法虽然名字叫replace
,但却没有改变字符串'abc'
的内容。相反,replace方法创建了一个新字符串'Abc'
并返回。