1. 字典介绍
在 Python 中字典属于一种映射类型,它和 set 相同,同样属于非线性结构,Python 官方对 dict 有如下解释:
- 一个映射对象映射一个可 hash 的值到任意一个对象上去。
- 映射是可变的对象。
- dict 是当前唯一一个标准的映射类型。
- 字典的键几乎可以是任意的值。
- 字典的值不必
可 hash
,也就是说值可以是列表,字典,或者其他任意可变的对象 - 如果 key 相同,那么后面的 value 将会覆盖先前的 value
- 不建议使用 float 类型作为字典的 key
简单来说:字典是由 key:value
键值对组成的数据的集合,它的主要特点是 可变的、无序的、不重复的。
字典的 key 必须是可 hash 对象,之所以快,因为其本质上是 用空间换时间。
2. 字典的基本操作
字典是除集合 (set) 以外另一种可变的非线性容器模型,在 Python 中非常强大,适合各种结构数据的存储、嵌套等。
2.1. 字典的定义
字典的每个 key 与 value 的键值对用冒号 :
分割,每对之间用逗号 ,
分割,整个字典包括在花括号 { }
中。例:{'a':1, 'b':2}
,Python 提供了多种创建字典的方式,如下:
- 基本格式:
d = dict()
或者d = {}
-
dict(**kwargs)
:使用name=value
对,来初始化一个字典 -
dict(iterable, **kwargs)
:使用可迭代对象和name=value
构造字典,注意 可迭代对象必须是一个二元结构 -
dict(mapping, **kwargs)
: 使用一个字典构造另一个字典 dic = {'a':1, 'b':2, 'c':3, 'd':[1,2,3]}
-
dic = dict.fromkeys(iterable, value)
: 使用可迭代对象的值作为 key 生成字典,value 默认为 0,否则用指定的 value 对字典进行初始化。
In : d1=dict()
In : d2={}
In : d3 = dict(a=1, b=2) ; d3
Out: {'a': 1, 'b': 2}
In : d4 = dict([('a', 1),('b', 2)], c=3, d=4) ; d4
Out: {'a': 1, 'b': 2, 'c': 3, 'd': 4}
In : d5 = dict(d4, e=5, f=6) ; d5
Out: {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6}
In : d7 = dict.fromkeys(range(5)) ; d7
Out: {0: None, 1: None, 2: None, 3: None, 4: None}
In : d8 = dict.fromkeys(range(5), 100) ; d8
Out: {0: 100, 1: 100, 2: 100, 3: 100, 4: 100}
2.2. 字典元素的访问
有如下三种方式访问字典的键值对:
-
d[key]
:返回 key 对应的 value,key 不存在抛出 KeyError 异常 -
dict.get(key[, default])
:返回 key 对应的 value,key 不存在返回缺省值,如果没有设置缺省值返回 None -
dict.setdefault(key[, default])
:返回 key 对应的值 value,key 不存在,添加key:value
键值对(value 设置为 default),并返回 value,如果 default 没有设置缺省为 None
In : dic = {'a':1, 'b':2, 'c':3, 'd':4}
In : dic['a']
Out: 1
In : dic['e'] # 不存在 'e' 这个 key,所以直接访问会出现异常
---------------------------------------------------------------------------
KeyError Traceback(most recent call last)
<ipython-input-34-87d22c709971> in <module>
----> 1 dic['e']
KeyError: 'e'
In : dic.get('a') # key 存在,则返回对应的值
Out: 1
In : dic.get('e') # 不存在,默认会返回 None,ipython 优化了 None 的输出,所以这里无显示
In : dic.get('e', 'not exist') # 不存在时,由指定的 default 进行返回
Out: 'not exist'
In : dic.setdefault('a', 'ok') # 设置 a 的值为 ok,a 存在,所以返回 a 对应的值 1
Out: 1
In : dic.setdefault('e', 'ok') # 设置 e 的值为 ok,e 不存在,所以设置并返回 value(key 不存在时等同于设置并访问了)
Out: 'ok'
In : dic
Out: {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 'ok'}
当然字典也可以被迭代访问,后面介绍
2.3. 字典的增删改
由于字典可变、非线性、无序的特性,而且字典的 key 必须是可 hash 的对象,查找某个 key 也是直接 hash(),然后找到对应的位置的,所以我们对它某个 key 的修改可以理解为是时间复杂度 O(1)
的操作,效率很高,主要有以下几种方法。
-
d[key] = value
: 将 key 对应的值修改为 value,key 不存在添加新的key:value
对。 -
dic.update([other]) --> None
: 使用另一个字典的k,v
对更新本字典,key 不存在时添加,存在时则覆盖,所以不会返回新的字典,属于原地修改。 -
dic.pop(key[, default])
: key 存在,移除它,并返回它的 value,key 不存在返回指定的 default,如果 default 未指定,那么会返回 KeyError 异常。 -
dic.popitem()
: 移除并返回一个任意的键值对,字典为 empty 时,抛出 KeyError 异常。 -
dic.clear()
: 清空字典。 -
del dic['a']
: 通用的删除变量方法。
In : dic = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 'ok'}
In : dic['a'] = 1000 ; dic
Out: {'a': 1000, 'b': 2, 'c': 3, 'd': 4, 'e': 'ok'}
In : dic2 = {'a':200,'f':50} ; dic.update(dic2) ; dic
Out: {'a': 200, 'b': 2, 'c': 3, 'd': 4, 'e': 'ok', 'f': 50}
In : dic.pop('a') # 弹出一个 key'a',key 存在返回 key 对应的 value
Out: 200
In : dic
Out: {'b': 2, 'c': 3, 'd': 4, 'e': 'ok', 'f': 50}
In : dic.pop('g') # 弹出一个 key'g',key 不存在,又没有指定 default,则会报 KeyError 异常
---------------------------------------------------------------------------
KeyError Traceback(most recent call last)
<ipython-input-49-311c3ba80251> in <module>
----> 1 dic.pop('g')
KeyError: 'g'
In : dic.pop('g','not exist') # 指定了 default,当 key 不存在时,会返回指定的 default 值
Out: 'not exist'
In : dic.popitem() # 弹出一个 key:valyue 键值对,返回对象是元组形式
Out:('d', 4)
In : dic
Out: {'b': 2, 'c': 3, 'e': 'ok', 'f': 50}
In : del dic['e'] ; dic
Out: {'b': 2, 'c': 3, 'f': 50}
In : dic.clear()
In : dic
Out: {}
当我们以字典的某个对象比如 keys,values,items 等为条件对字典进行遍历时,我们不能在遍历的同时删除字典的元素,字典在运行时不允许长度改变,但是在 list 中这种操作是可以的,但是会得到意想不到的结果,建议对容器进行遍历的同时不要修改它的长度。
In : s = {'a': 1, 'b': 2, 'c': 4, 'd': 5, 'e': 7, 'j': 10}
In : len(s)
Out: 6
In : for i in range(6):
...: s.popitem()
...:
In : s
Out: {}
# 下面这种方式是错的,也是绝对不可以的。
In : for i in s.keys():
...: s.pop(i)
...:
---------------------------------------------------------------------------
RuntimeError Traceback (most recent call last)
<ipython-input-35-9c51f70f750a> in <module>
----> 1 for i in s.keys():
2 s.pop(i)
3
RuntimeError: dictionary changed size during iteration
3. 字典遍历
在 Python 中,我们所说的基本数据结构:字符串、元组、列表,集合,包括字典,都可以认为是一个容器箱子,只要是容器,我们就可以进行遍历(是否有序和是否可以遍历没有必然关系,只不过有序的话是顺序拿出,而无序则是随机拿出),我们可以使用多种方式对字典进行迭代遍历,但是有些地方和其他类型不同。
3.1. 遍历字典的 key
dic.keys()
: --> dict_keys
--> 返回字典 dic 的所有 key 组成的一个 dict_keys 视图集合(类 set 结构,不会生成新的内存空间)。
In : dic = {'a':1, 'b':2, 'c':3, 'd':4}
In : for key in dic:
...: print(key)
...:
a
d
c
b
In : for key in dic.keys():
...: print(key)
...:
a
d
c
b
In : dic.keys()
Out: dict_keys(['a', 'd', 'c', 'b'])
迭代字典就是在迭代字典的 key,所以直接迭代字典和使用字典的 keys() 方法返回一个 keys 的视图然后再迭代,是一样的效果。
3.2. 遍历字典的 value
dic.values()
: --> dict_values
--> 返回字典 dic 的所有 values 组成的一个 dict_values 视图集合(类 set 结构,不会生成新的内存空间)。
In : for i in dic:
...: print(dic[i])
...:
1
2
3
4
In : for i in dic.values():
...: print(i)
...:
1
2
3
4
In : dic.values()
Out: dict_values([1, 2, 3, 4])
可以首先遍历字典的 key,然后再通过 key 来访问对应的 value,也可以通过 dic.values() 直接访问 values。
3.3. 变量字典的键值对
dic.items(): --> dict_items
:返回字典 dic 的所有的 key 和 value(每个 key 和 value 的键值对由元组表示) 组成的一个 dict_items 视图集合(类 set 结构,不会生成新的内存空间)。
In : for i in dic.items():
...: print(i)
...:
('a', 1)
('b', 2)
('c', 3)
('d', 4)
In : for key,value in dic.items():
...: print('key:{} value:{}'.format(key,value))
...:
key:a value:1
key:b value:2
key:c value:3
key:d value:4
由于返回的每个键值对为元组格式,那么利用我们前面学的封装与解构,可以很方便的获取 key 和它对应的 value
3.4. 字典遍历小结
在 Python3 中,keys、values、items 方法返回一个类似生成器的可迭代对象,不会把函数的返回结果复制到内存空间中。
- Dictionary view 对象,可以使用 len()、iter()、in 操作
- 字典的 entry 的动态视图,字典变化,视图将反映出这些变化
- keys 返回一个类似 set 的对象,也可以看作是一个 set 集合,如果 values 可 hash 的话,那么 items 也可以看作是类 set 对象
Python 2 中,keys、values、items 方法会返回一个新的列表,占据新的内存空间,所以 Python 2 建议使用 iterkeys、itervalues、iteritems,返回一个迭代器,而不是返回一个 copy
[11:20:32 python@centos7 ~]$ python
Python 2.7.5(default, Oct 30 2018, 23:45:53)
[GCC 4.8.5 20150623(Red Hat 4.8.5-36)] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> s = {'a':1,'b':2}
>>> s.keys() # 直接生成一个 keys 的列表
['a', 'b']
>>> s.iterkeys() # 对象,迭代可以获取数据
<dictionary-keyiterator object at 0x7f271c5fa520>
4. defaultdict 默认值字典
defaultdit object 是 dict 的子类,我们称它为默认值字典,即在创建字典时给所有的 value 指定一个默认值,它存放在 collections 模块中,使用前需要先进行导入。为什么有默认值字典这种类型呢?请看如下代码:
dic = {}
for i in 'abacdabeddfef':
if i not in dic: # 这句其实也可以优化为 dic[i] = dic.get(i, 0) + 1
dic[i] = 0
dic[i] += 1
print(dic)
# 结果:
{'a': 3, 'b': 2, 'c': 1, 'd': 3, 'e': 2, 'f': 2}
我们在计算一个字符串或者一个列表中的元素重复的次数时,通常会用到字典对齐进行计数,如果元素不存在字典中,那么就需要初始化元素,当我们使用默认值字典时,就可以优化的更简洁。
当 key 不存在时,返回的是工厂函数的默认值,比如 list 对应 [ ],str 对应的是空字符串,set 对应 set( ),int 对应 0
from collections import defaultdict
dic = defaultdict(int) # defaultdict(lambda :0) 这种方法也可以设置默认为 0
for i in 'abacdabeddfef':
dic[i] += 1 # 默认是 int 型,可以直接加减
print(dic)
# 结果:
defaultdict(<class 'int'>, {'a': 3, 'b': 2, 'c': 1, 'd': 3, 'e': 2, 'f': 2})
5. OrderedDict 有序字典
Ordered dictionaries 像一个有序字典,但是它记住的是插入元素的顺序。当我们迭代有序字典时,它会按照这些键值对插入的顺序返回。它同样存在于 collections 模块中,需要使用时请先导入。
In : from collections import OrderedDict
In : dic = OrderedDict()
In : dic = dic.fromkeys('abc', 1) ; dic
Out: OrderedDict([('a', 1),('b', 1),('c', 1)])
In : for k,v in dic.items(): # 按照插入的顺序
...: print(k, v)
...:
a 1
b 1
c 1
In : dic = dict([('a', 1),('b', 1),('c', 1)])
In : for k,v in dic.items(): # 无序的
...: print(k, v)
...:
a 1
c 1
b 1
注意:在 3.6 的版本的 python/ipython 解释器中,直接迭代或者打印时,是有序的(OrderedDict),但是在 3.5 版本以前都是随机的,千万不要以为字典是有序的!