压缩列表(ziplist
)是列表键和哈希键的底层实现之一。
7.1 压缩列表的构成
压缩列表是Redis
为了节约内存而开发的,是由一系列特殊编码的连续内存块组成的顺序性数据结构。一个压缩列表可以包含任意多个节点,每个节点可以保存一个字节数组或者一个整数值。
zlbytes |
zltail |
zllen |
entry1 |
entry2 |
... | entryN |
zlend |
---|
压缩列表各个组成部分的详细说明
属性 | 用途 |
---|---|
zlbytes |
记录整个压缩列表占用的内存字节数:在对压缩列表进行内存重分配,或者计算zlend 的位置时使用 |
zltail |
记录压缩列表表尾节点距离压缩列表的起始地址有多少个字节:通过这个偏移量,程序无需遍历整个压缩列表就可以确定表尾节点的地址 |
zllen |
记录了压缩列表包含的节点数量 |
entryX |
压缩列表包含的各个节点,节点的长度由节点保存的内存决定 |
zlend |
特殊值oxFF (十进制255),用于标记压缩列表的末尾 |
7.2 压缩列表节点的构成
每个压缩列表节点可以保存一个字节数组或者一个整数值。
previous_entry_length |
encoding |
content |
---|
每个压缩列表节点都由previous_entry_length
、encoding
、content
三个部分组成
7.2.1 previous_entry_length
节点的previous_entry_length
属性以字节为单位,记录了压缩列表中前一个节点的长度。previous_entry_length
属性的长度可以是1字节或者5字节:
- 如果前一节点的长度小于254字节,那么
previous_entry_length
属性的长度为1字节:前一节点的长度就保存在这一个字节里面 - 如果前一个节点的长度大于254字节,那么
previous_entry_length
属性的长度为5字节:其中属性的第一个字节会被设置为oxFE
,而之后的四个字节则用于保存前一个节点的长度。
因为节点的previous_entry_length
属性记录了前一个节点的长度,所以程序可以通过指针运算,根据当前节点的起始地址计算出前一个节点的起始地址。
压缩列表从表尾向表头遍历操作就是使用这一原理实现的,只要我们拥有一个指向某个节点起始地址的指针,那么通过这个指针以及这个节点的previous_entry_length
属性,程序就可以一直向前一个节点回溯,最终到达压缩列表的表头节点。
7.2.2 encoding
节点的encoding
属性记录了节点的content
属性所保存数据的类型以及长度
7.2.3 content
节点的content
属性负责保存节点的值,节点值可以是一个字节数组或者整数,值的类型和长度由节点的encoding
属性决定。
7.3 连锁更新
每个节点的previous_entry_length
属性都记录了前一个节点的长度
- 如果前一个节点的长度小于254,那么
previous_entry_length
属性需要用1字节长的空间来保存这个长度值 - 如果前一个节点的长度大于等于254,那么
previous_entry_length
属性需要5字节长的空间来保存这个长度值
考虑这样一种情况:在一个压缩列表中,有多个连续的、长度介于250字节到253字节之间的节点e1至eN
|zlbytes
|zltail
|zllen
|e1
|e2
|e3
|...|eN
|zlend
|
因为e1至eN的所有节点的长度都小于254字节,所以记录这些节点的长度只需要1字节长的previous_entry_length
属性,换句话说,e1至eN的所有节点的previous_entry_length
属性都是1字节长的。
如果我们将一个长度大于等于254字节的新节点new设置到压缩列表的表头节点,那么new将成为e1的潜质节点。
此时e1到eN的每个节点的previous_entry_length
属性都要扩展为5字节以符合压缩列表对节点的要求,程序需要不断的对压缩列表进行空间重分配操作。
Redis将这种在特殊情况下产生的多次空间扩展操作称之为“连锁更新”。
除了添加新节点可能会引发连锁更新之外,删除节点也可能会连锁更新。
因为连锁更新在最坏情况下需要对压缩列表执行N
次空间重分配操作,而每次空间重分配的最坏复杂度为O(N)
,所以连锁更新的最坏复杂度为O(N2)。
注意的是,尽管连锁更新的复杂度较高,但它真正赵成性能问题的几率是很低的: - 首先,压缩列表里要恰好有多个连续的、长度介于250字节至253字节之间的节点,连锁更新才有可能被引发,在实际中,这种情况并不多见;
- 其次,即使出现连锁更新,但只要更新的节点数量不多,就不会对性能造成任何影响:比如说,对三五个节点进行连锁更新是绝对不会影响性能的;