测试环境:Centos7+Python3.5
Python3中,常见的数据结构有四种,list, dict, set, tuple,以下是他们的一些比较
一、简介
list:列表,与C语言的list稍有不同。第一,Python的list可存储不同类型的数据;第二,Python的list分配空间时会多分一部分空间,避免重复创建list带来的开销。
上图就是list的内部实现,由于索引和数据是分离的,所以数据的类型可以是整型,或者是字符串,甚至是另一个list。
tuple:有序列表,但初始化后数据便不可修改(没有提供增删查改的方法)
dict:哈希表,数据存储的格式是一种键值对(key-value)的形式。根据key的值能直接找到对应的内存地址,进而找到数据,所以查找速度比list快
set:set的实现跟dict类似,只不过少了key,且数据不可重复
二、适用场景(优缺点,存在的意义)
list VS tuple:
1.list和tuple都是有序列表
2.list内的数据是可增删查改的,而tuple内的数据一旦初始化后便不可修改
list VS dict:
- list是有序的,dict是无序的;
- 两者都是可增删查改的;
- list的插入查找速度没有比dict快,且随着数据的增大差距更明显;
- 虽然list的速度较慢,但是占用内存较小(不用存储key)
set:set的数据也是无序的,适合于数据不重复的场景
三、增删查改及对应的时间复杂度(占用的空间)
http://www.orangecube.net/python-time-complexity
四、数据的迭代
四者都可通过for循环迭代,只不过dict迭代的是key
五、数据的排序
# list 有两种方式排序
>>> a = [3, 2, 1] # 默认是升序,从低到高,可通过reverse参数指定升降序
>>> a.sort()
>>> a
[1, 2, 3]
>>> a
[3, 2, 1]
>>> sorted(a)
[1, 2, 3]
# dict
## 如果传入的是整个字典,则默认对key进行排序,key这个参数就没有作用
>>> d = {'aa': 1, 'bb': 2, 'cc': 5, 'ss': 3}
>>> d_sort = sorted(d, key=lambda x: x[1])
>>> d_sort
['aa', 'bb', 'cc', 'ss']
## 如果传入的是字典元素,则key参数起作用,可通过key排序,也可通过value排序,返回一个list
>>> d_sort = sorted(d.items(), key=lambda x: x[1], reverse=False)
>>> d_sort
[('aa', 1), ('bb', 2), ('ss', 3), ('cc', 5)]
# set的排序返回的是一个list
a = {1, 2, 3}
>>> sorted(a)
[1, 2, 3]
>>> type(sorted(a))
<class 'list'>
# tuple 数据不可变,所以不可以排序
六、数据的差集,交集和并集
list(set(a).union(set(b))) # 并集
list(set(b).difference(set(a))) # 差集, b中有而a中没有的
list(set(a).intersection(set(b))) # 交集
七、数据的排列组合
转载自此文章:https://blog.csdn.net/lanchunhui/article/details/49494265
组合
from itertools import combinations
combins = [c for c in combinations(range(5), 2)]
combins # 而且是按序排列
[(0, 1), (0, 2), (0, 3), (0, 4), (1, 2), (1, 3), (1, 4), (2, 3), (2, 4), (3, 4)]
排列
from itertools import permutations
perms = permutations(range(5), 2)
perms
[(0, 1), (0, 2), (0, 3), (0, 4), (1, 0), (1, 2), (1, 3), (1, 4), (2, 0), (2, 1),
(2, 3), (2, 4), (3, 0), (3, 1), (3, 2), (3, 4), (4, 0), (4, 1), (4, 2), (4, 3)]
八、其它
1.dict 替换 key (dict[new_key] = dict.pop(key))
http://blog.csdn.net/jt674106399/article/details/76516186
2.dict 判断键是否存在(py2 用 dict.has_keys(), py3 用 key in dict)
https://blog.csdn.net/maverick1990/article/details/19908507
3.biset: 二分排序模块,比list高效
http://python.jobbole.com/86609/
https://www.cnblogs.com/skydesign/archive/2011/09/02/2163592.html
4.memoryview 和 bytearray: 适用与字节情况,如socket
https://segmentfault.com/q/1010000007137721
- List的append方法和 + 区别
list = list + [i] # 将list 和 [i] 的值合并成一个新的list, 开销大
list += [i] # 在list上直接操作,时间快一点