概述
- 压缩列表是列表、哈希的底层实现之一
- 当列表只包含少量列表项,并且要么是小整数值、短字符串时,采用压缩列表
- 哈希表只包含少量键值对,键值对的键和值要么都是小整数、短字符串,采用压缩列表实现哈希
<zlbytes> 是一个无符号整数,保存着 ziplist 使用的内存数量。
通过这个值,程序可以直接对 ziplist 的内存大小进行调整,
而无须为了计算 ziplist 的内存大小而遍历整个列表。
<zltail> is the offset to the last entry in the list. This allows a pop
operation on the far side of the list without the need for full traversal.
<zltail> 保存着到达列表中最后一个节点的偏移量。
这个偏移量使得对表尾的 pop 操作可以在无须遍历整个列表的情况下进行。
<zllen> is the number of entries.When this value is larger than 2**16-2,
we need to traverse the entire list to know how many items it holds.
<zllen> 保存着列表中的节点数量。
当 zllen 保存的值大于 2**16-2 时,
程序需要遍历整个列表才能知道列表实际包含了多少个节点。
<zlend> is a single byte special value, equal to 255, which indicates the
end of the list.
<zlend> 的长度为 1 字节,值为 255 ,标识列表的末尾。
- 每个 ziplist 节点的前面都带有一个 header ,这个 header 包含两部分信息:
- 前置节点的长度,在程序从后向前遍历时使用。
- 当前节点所保存的值的类型和长度。
编码前置节点的长度的方法如下:
如果前置节点的长度小于 254 字节,那么程序将使用 1 个字节来保存这个长度值。
-
如果前置节点的长度大于等于 254 字节,那么程序将使用 5 个字节来保存这个长度值:
- 第 1 个字节的值将被设为 254 ,用于标识这是一个 5 字节长的长度值。
- 之后的 4 个字节则用于保存前置节点的实际长度。
header 另一部分的内容和节点所保存的值有关。
- 如果节点保存的是字符串值,
那么这部分 header 的头 2 个位将保存编码字符串长度所使用的类型,
而之后跟着的内容则是字符串的实际长度。
- |00pppppp| - 1 byte
String value with length less than or equal to 63 bytes (6 bits).
字符串的长度小于或等于 63 字节。 - |01pppppp|qqqqqqqq| - 2 bytes
String value with length less than or equal to 16383 bytes (14 bits).
字符串的长度小于或等于 16383 字节。 - |10______|qqqqqqqq|rrrrrrrr|ssssssss|tttttttt| - 5 bytes
String value with length greater than or equal to 16384 bytes.
字符串的长度大于或等于 16384 字节。
- 如果节点保存的是整数值,
那么这部分 header 的头 2 位都将被设置为 1 ,
而之后跟着的 2 位则用于标识节点所保存的整数的类型。
- |11000000| - 1 byte
Integer encoded as int16_t (2 bytes).
节点的值为 int16_t 类型的整数,长度为 2 字节。 - |11010000| - 1 byte
Integer encoded as int32_t (4 bytes).
节点的值为 int32_t 类型的整数,长度为 4 字节。 - |11100000| - 1 byte
Integer encoded as int64_t (8 bytes).
节点的值为 int64_t 类型的整数,长度为 8 字节。 - |11110000| - 1 byte
Integer encoded as 24 bit signed (3 bytes).
节点的值为 24 位(3 字节)长的整数。 - |11111110| - 1 byte
Integer encoded as 8 bit signed (1 byte).
节点的值为 8 位(1 字节)长的整数。 - |1111xxxx| - (with xxxx between 0000 and 1101) immediate 4 bit integer.
Unsigned integer from 0 to 12. The encoded value is actually from
1 to 13 because 0000 and 1111 can not be used, so 1 should be
subtracted from the encoded 4 bit value to obtain the right value.
节点的值为介于 0 至 12 之间的无符号整数。
因为 0000 和 1111 都不能使用,所以位的实际值将是 1 至 13 。
程序在取得这 4 个位的值之后,还需要减去 1 ,才能计算出正确的值。
比如说,如果位的值为 0001 = 1 ,那么程序返回的值将是 1 - 1 = 0 。 - |11111111| - End of ziplist.
ziplist 的结尾标识
所有整数都表示为小端字节序。
ziplist 示例图
/*
空白 ziplist 示例图
area |<---- ziplist header ---->|<-- end -->|
size 4 bytes 4 bytes 2 bytes 1 byte
+---------+--------+-------+-----------+
component | zlbytes | zltail | zllen | zlend |
| | | | |
value | 1011 | 1010 | 0 | 1111 1111 |
+---------+--------+-------+-----------+
^
|
ZIPLIST_ENTRY_HEAD
&
address ZIPLIST_ENTRY_TAIL
&
ZIPLIST_ENTRY_END
非空 ziplist 示例图
area |<---- ziplist header ---->|<----------- entries ------------->|<-end->|
size 4 bytes 4 bytes 2 bytes ? ? ? ? 1 byte
+---------+--------+-------+--------+--------+--------+--------+-------+
component | zlbytes | zltail | zllen | entry1 | entry2 | ... | entryN | zlend |
+---------+--------+-------+--------+--------+--------+--------+-------+
^ ^ ^
address | | |
ZIPLIST_ENTRY_HEAD | ZIPLIST_ENTRY_END
|
ZIPLIST_ENTRY_TAIL
*/