Redis | 第2章跳跃表、整数集合与压缩列表《Redis设计与实现》

前言

参考资料：《Redis设计与实现第二版》；

本篇笔记按照书里的脉络，将知识点分为四个部分。其中第一部分数据结构与对象分为上中下篇，上篇包括：SDS、链表和字典；中篇包括跳跃表、整数集合和压缩列表；下篇为对象；

上篇的链接：https://www.jianshu.com/p/33f4cb95c008

下篇的链接：https://www.jianshu.com/p/56efcba460a7

与本章相关的 Redis 命令总结在下篇文章，欢迎点击收藏，本篇将不再重复：

《Redis常用命令及示例总结（API）》：https://www.jianshu.com/p/f8eb9afaa908

1. 跳跃表

跳跃表支持平均 O(logN)、最坏 O(N) 复杂度的节点查找，还可以通过顺序性操作来批量处理节点；
跳跃表的效率可以媲美平衡树，实现比平衡树简单；
跳跃表在Redis里只有两个应用：有序集合键的底层实现、集群节点中用作内部数据结构；

1.1 跳跃表与其节点的定义

跳跃表的定义，在redis.h/zskiplist结构里：

typedef struct zskiplist {
    //表头节点和表尾节点
    structz skiplistNode *header, *tail;
    //表中节点的数量（不包括表头指针）
    unsigned long length;
    //表中层数最大的节点的层数（不包括表头指针）
    int level;
} zskiplist;

跳跃表节点的定义，在redis.h/zskiplistNode结构里：
```
typedef struct zskiplistNode{
    //后退指针
    struct zskiplistNode *backwars;
    //分值
    double score;
    //成员对象
    robj *obj;
    //层
    struct zskiplistLevel{
        //前进指针
        struct zskiplistNode *forward;
        //跨度
        unsigned int apan;
    } level[];
} askiplistNode;
```
- 节点中使用L1、L2、L3等来标记节点的各个层，每个层有前进指针和跨度；
  - 带数字的箭头为前进指针，数字为跨度；
  - 一般来说，层数越多访问其他节点速度越快；
  - 创建新跳跃表节点时，随机生成介于1和32之间的数作为level数组的大小；
  - 跨度与遍历无关，与排位rank有关。查找某个节点时，将沿途层相加，得到排位；
- 带BW字样的为后退指针；
- 1.0、2.0、3.0为分值，分值从小到大排列；
  - 当分值相同时，成员对象在字典中排序小的靠近表头节点；
- o1、o2、o3等是成员对象，成员对象必须唯一；
- 表头节点也有后退指针、分值和成员对象，不会用到所以图中没有显示；
- 下图中level为5是因为o3对象有5层，为该跳跃表中最大层；
  [图片上传中...(跳跃表逻辑图.png-3e98f2-1637400003565-0)]

1.2 跳跃表的API

函数	作用	时间复杂度
zslCreate	创建一个新的跳跃表	O(1)
zslFree	释放给定跳跃表，以及表中包含的所有节点	O(N)，N为跳跃表的长度
zslInsert	将包含给定成员和分值的新节点添加到跳跃表中	平均O(logN)，最坏O(N)，N为跳跃表长度
zslDelete	删除跳跃表中包含给定成员和分值的节点	平均O(logN)，最坏O(N)，N为跳跃表长度
zslGetRank	返回包含给定成员和分值的节点在跳跃表中的排位	平均O(logN)，最坏O(N)，N为跳跃表长度
zslGetElementByRank	返回包含给定成员和分值的节点在跳跃表中的排位	平均O(logN) ，最坏O(N)，N为跳跃表长度
zslIsInRange	给定一个分值范围（range），比如0到15，20到28，诸如此类，如果给定的分值范围包含在跳跃表的分值范围内，返回1，否则返回0	O(1)，基于通过跳跃表的表头节点和表尾节点的分值得到范围
zslFirstInRange	给定一个分值范围，返回跳跃表中第一个符合这个范围的节点	平均O(logN)，最坏O(N)，N为跳跃表长度
zslLastInRange	给定一个分值范围，返回跳跃表中最后一个符合这个范围的节点	平均O(logN)，最坏O(N)，N为跳跃表长度
zslDeleteRangeByScore	给定一个分值范围，删除跳跃表中所有在这个范围之内的节点	O(N)，N为被删除节点数量
zslDeleteRangeByRank	给定一个排位范围，删除跳跃表中所有在这个范围之内的节点	O(N)，N为被删除节点数量

2. 整数集合

整数集合 intset，其特点是从小到大保存整数且不会重复；
整数集合在Redis里的应用：集合键的底层实现；

2.1 整数集合的实现

整数集合的定义，在intset.h/intset结构中：
```
typedef struct intset{
    //编码方式
    uint32_t encoding;
    //集合包含的元素数量
    uint32_t length;
    //保存元素的数组
    int8_t contents[];
} intset;
```
- contents声明为 int8_t 类型的数组，但数组的真正类型取决于encoding属性的值；
encoding值 contents值范围

INTSET_ENC_INT16 int16_t -32768~32768

INTSET_ENC_INT32 int32_t -2147483648~2147483647

INTSET_ENC_INT64 int64_t -9223372036854775808~9223372036854775807

encoding值	contents值	范围
INTSET_ENC_INT16	int16_t	-32768~32768
INTSET_ENC_INT32	int32_t	-2147483648~2147483647
INTSET_ENC_INT64	int64_t	-9223372036854775808~9223372036854775807

整数集合逻辑图.png

2.2 整数集合的类型升级

当新增的元素类型比整数集合现有元素的类型长时，需要升级；
步骤：
- 根据新元素类型，扩展整数集合底层数组空间大小，并为新元素分配空间；
- 将底层数组现有元素转换成新元素相同的类型，在维持集合有序性质不变情况下将转换后的元素放置到正确位置上；
- 将新元素添加到底层数组里；
因为添加新元素可能会引起升级，每次升级需要对所有元素进行类型转换，因此时间复杂度为O(N)；
因为引起升级操作的新元素比现有元素长，所以新元素要么添加到数组开头，要么数组末尾；
好处：
- 灵活性：C语言通常不会将不同类型值放在同一个数据结构里，Redis的升级使其可以；
- 节约内存；
整数集合不允许降级操作；

2.3 整数集合的API

函数	作用	时间复杂度
intsetNew	创建一个新的整数集合	O(1)
intsetAdd	将给定元素添加到整数集合里面	O(N)
intsetRemove	从整数集合中移除给定元素	O(N)
intsetFind	检查给定值是否存在于集合	O(logN)，整数集合有序排列，可以用二分查找法
intsetRandom	从整数集合中随机返回一个元素	O(1)
intsetGet	取出底层数组在给定索引上的元素	O(1)
intsetLen	返回整数集合包含的元素个数	O(1)
intsetBlobLen	返回整数集合咱用的内存字节数	O(1)

3. 压缩列表

压缩列表 ziplist，其特点是管理小整数值和短字符串；
压缩列表在Redis里的应用：列表键与哈希键的底层实现之一；
压缩列表的Redis为节省内存而开发的，是由一系列特殊编码的连续内存块组成的顺序型（sequential）数据结构；

3.1 压缩列表的结构

压缩列表是由一系列特殊编码的连续内存块组成的顺序型数据结构；

ziplist 示例图.png

压缩列表各组成部分说明.png

3.2 压缩列表节点的定义

节点的定义在ziplist.c/zlentry结构里：

typedef struct zlentry {
    // prevrawlen ：前置节点的长度
    // prevrawlensize ：编码 prevrawlen 所需的字节大小
    unsigned int prevrawlensize, prevrawlen;
    // len ：当前节点值的长度
    // lensize ：编码 len 所需的字节大小
    unsigned int lensize, len;
    // 当前节点 header 的大小
    // 等于 prevrawlensize + lensize
    unsigned int headersize;
    // 当前节点值所使用的编码类型
    unsigned char encoding;
    // 指向当前节点的指针
    unsigned char *p;
} zlentry;

可以用当前节点地址减去prevrawlen的值获得前置节点的首地址，可以由此实现从尾到头的遍历；
*p指向一个content，保存节点的值，值的类型和长度由encoding决定；
encoding的属性（下划线表示留空，abcdx代表实际二进制数据）：

encoding的编码方式.png

3.3 连锁更新

首先，压缩列表节点有个prevrawlen属性，用于记录前一个节点的长度，前一个节点的长度变化会影响prevrawlen属性的长度取值（使用1个字节存储前一个节点的长度还是5个）；
假设所有结点（e1, e2......eN）长度介于250~253字节之间，在表头新增长度大于等于254字节的new节点，因为e1的prevrawlen属性仅1字节，无法保存大于254的数字（new的长度），因此需要扩展为5字节长，此时e1的长度介于254~257字节之间。这样，new引发e1的扩展，e1引发e2的扩展，形成连锁更新；
删除节点也可能引发连锁更新；
连锁更新的最坏时间复杂度为 O(N²)；
在实际中，连锁更新造成的性能问题几率很低；

3.4 压缩列表的API

函数	作用	时间复杂度
ziplistNew	创建一个新的压缩列表	O(1)
ziplistPush	创建一个包含给定值的新节点，并将这个新节点添加到压缩列表的表头或表尾	平均O(N)，最坏O(N²)
ziplistInsert	将包含给定值的新节点插入到给定节点之后	平均O(N)，最坏O(N²)
ziplistIndex	返回压缩列表给定索引上的节点	O(N)
ziplistFind	在压缩列表中查找并返回包含了给定值的节点	当保存的是字节数字时为O(N²)，整数时为O(N)
ziplistNext	返回给定节点的下一个节点	O(1)
ziplistPrev	返回给定节点的前一个节点	O(1)
ziplistGet	获取给顶节点说保存的值	O(1)
ziplistDelete	从压缩列表中删除给定的节点	平均O(N)，最坏O(N²)
ziplistDeleteRange	删除压缩列表在给定索引上的连续多个节点	平均O(N)，最坏O(N²)
ziplistBlobLen	返回压缩列表目前占用的内存字节数	O(1)
ziplistLen	返回压缩列表目前包含的节点数量	节点数量小于65535时为O(1)，大于65535时为O(N)

最坏时间复杂度为O(N²)是因为可能引发连锁更新；

最后

$\color{blue}{\rm\small{新人制作，如有错误，欢迎指出，感激不尽！}}$

$\color{blue}{\rm\small{欢迎关注我，并与我交流！}}$

$\color{blue}{\rm\small{如需转载，请标注出处！}}$

最后编辑于：2021.12.03 19:47:18

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,793评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,567评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,342评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,825评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,814评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,680评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,033评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,687评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 42,175评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,668评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,775评论 1赞 332
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,419评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,020评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,978评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,206评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,092评论 2赞 351
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,510评论 2赞 343

Redis | 第2章 跳跃表、整数集合与压缩列表《Redis设计与实现》

前言