简读笔记-Redis设计与实现第二章

第二部分 单机数据库的实现

数据库


服务器中的数据库

  • Redis服务器的所有数据库都保存在redisServer.db数组中,而数据库的数量使用redisServer.dbnum属性保存

切换数据库

  • 客户端通过修改目标数据库指针,让它指向redisServer.db数组中的不同元素来切换不同的数据库

数据库键空间

  • 数据库主要由dict和expires两个字典域构成,其中dict字典负责保存键值对,而expires字典则负责键的过期时间
  • 因为数据库由字典构成,因此对数据库的操作都是建立在对字典操作之上
  • 数据库的键总是一个字符串对象,而值则可以是任意一种Redis对象类型,包括字符串对象、哈希表对象、集合对象、列表对象、有序集合对象。
image

设置键的过期时间

  • expires字典的键指向数据库中的某个键,而值则记录了数据库键的过期时间,过期时间以毫秒为单位的UNIX时间戳

过期键删除策略

  • 三种不同的删除策略

    • 定时删除
      • 在设置一个键的同时,创建一个定时器,让定时器在键过期时间来临时,立即执行对键的删除操作
      • 优点: 对内存友好,能尽快地将过期键占用的内存释放
      • 缺点: 对时间不友好,如果过期键很多,那么会占用大量CPU时间,影响服务器响应时间和吞吐量
    • 惰性删除
      • 放任过期键不管,但是每次从键空间中获取键时,都检查取得的键是否过期,如果过期,就删除该键;如果没有过期,就返回该键
      • 优点:对时间友好,只有当取出过期键时,才将该键删除
      • 缺点:对空间不友好,大量过期无用键占用内存,由内存泄露的风险
    • 定期删除
      • 每个一段时间,程序就对数据库进行一次检查,删除里面的过期键,至于要删除多少过期键,以及要检查多少个数据库,由算法决定
      • 优点: 对上面两种策略的折衷。 对内存友好,对空间友好
      • 关键是如何决定删除操作执行的时常和频率
  • Redis的过期键删除策略

    • Redis使用的是 定期删除+ 惰性删除 保证过期键一定能被删除。并合理利用CPU时间和避免内存空间浪费

    • 惰性删除 : 在执行命令之前,对输入的键进行过期检查

    • 定期删除 : 在规定时间内,分多次遍历服务器中多个数据库,从数据库中的expires字典随机检查一部分键的过期时间,并删除其中的过期键。

AOF、RDB和复制功能对过期键的处理

  • 执行SAVE命令或者BGSAVE命令所产生的新RDB文件不会包含已过期的键
  • 执行BGREWRITEAOF命令所产生的重写AOF文件不会包含已过期的键
    • 当一个过期键被删除之后,服务器会追加一条DEL命令到现有的AOF文件末尾,显示地删除过期键
  • 当载入RDB or AOF文件时,会对文件保存的键进行检查,过期的键会被忽略。
  • 从服务器即使发现过期键也不会主动删除,而是等待主节点发来DEL命令,这种统一、中心化的过期键删除策略可以保证主从服务器的数据一致性。

数据库通知

  • 当Redis命令对数据库进行修改之后 , 服务器会根据配置向客户端发出数据库通知 (PUB/SUB)
    • 键空间通知: 某个键执行了什么命令(SET / EXPIRE / DEL)
  • 键事件通知: 某个命令被哪些键执行了 (KEY1 / KEY2 / KEY3)

RDB持久化


前置知识: 进程和子进程

image

可以看出,子进程和父进程的代码区是共享的而数据区和PCB块是父进程的副本

子PCB中的PID字段为新分配子进程PID,数据集字段为数据集地址。

父进程和子进程是可以并行执行的。互不干扰。

RDB文件的创建与载入

  • RDB持久化通过保存数据库中的键值对来记录数据库的状态 , 生成经过压缩的二进制文件。

  • 创建过程

    • SAVE命令由服务器进程直接执行保存操作,因此该命令会阻塞服务器
    • BGSAVE由子进程执行保存操作,所以该命令不会阻塞服务器
  • 载入过程

    • 如果服务器开启了AOF持久化功能,那么服务器会优先使用AOF文件还原数据库状态
    • 如果AOF处于关闭状态,服务器才会使用RDB文件来还原数据库状态(前者丢失的数据更少)

自动间隔性保存

  • 服务器状态中会保存所有用save选项设置的保存条件,当任意一个保存条件被满足时,服务器会自动执行BGSAVE命令。

    #redis.conf
    格式: save 时间 修改次数
    save 900 1   (900s内修改1次)
    save 300 10
    save 60 10000 (60s内修改10000次)
    
    struct redisServer{
        struct saveparam *saveparams; //记录保存条件的数据
        long long dirty;  //修改计数器
        time_t lastsave;  //上一次执行保存的时间
    }
    

RDB文件的结构

  • 对于不同类型的键值对,RDB文件会使用不同的方式来保存他们
image

AOF持久化


AOF(Append Only File)持久化实现

  • RDB持久化通过保存数据库中的键值对来记录数据库状态的不同

  • AOF持久化是通过保存Redis服务器所执行的写命令来记录数据库状态的

    image
  • AOF文件中所有命令都是以Redis命令请求协议的格式(文本协议)保存的

  • 命令请求会先保存到AOF缓冲区里面,之后再定期写入并同步到AOF文件中

    • 由于内存和磁盘的输入/输出速度不匹配,因此会将数据先写入缓冲区。系统提供了fsync, fdatasync两个同步函数(系统调用),让操作系统立即将缓冲区的数据写入硬盘中,减少缓冲区由于宕机而丢失数据的影响
  • appendfsync选项的不通值对AOF持久化功能的安全性和Redis服务器的性能有很大的影响

    • always : 每个事件循环都将aof_buf缓冲区内容写入同步到AOF文件
    • everysec(默认) : 每个事件循环后,判断上一次AOF是否间隔1S,如果是,则将aof_buf缓冲区内容写入同步到AOF文件。 因此就算故障停机,缓存也只丢失1S的数据。
    • no : 什么时候将缓冲区内容同步到AOF文件中,由操作系统决定

AOF文件的载入与数据还原

  • 服务器只要载入并重新执行保存在AOF文件中的命令(使用伪客户端),就可以还原数据库本来的状态了。

AOF重写

  • 为了解决AOF体积膨胀的问题,提供了AOF重写机制。AOF重写可以产生一个新的AOF文件,这个新的AOF文件和原有的AOF文件保存的数据库状态是一样的,但体积更小
  • AOF重写是一个由歧义的名字,程序无需对现有AOF文件进行任何装入、分析和写入操作。它是通过读取数据库中的键值对来实现的。
  • AOF重写程序放在子进程中执行,此时服务器进程可以继续处理命令请求
  • 子进程带有服务器进程数据的副本(数据一致性问题),那么如果在重写过程中有新的写请求更改数据库状态,就会产生当前数据库状态与重写后的AOF文件状态不一致问题。
  • 在执行BGREWRITEAOF命令时,Redis服务器会维护一个AOF重写缓冲区,该缓冲区会在子进程创建新AOF文件期间,记录服务器执行的所有写命令。当子进程完成创建新AOF文件的工作后,服务器会将重写缓冲区中的所有内容追加到新的AOF文件的末尾,使得新旧两个AOF文件所保存的数据状态一致。随后,用新的AOF文件替换旧的AOF文件,以此来完成AOF文件重写操作
  • image
    • 在AOF重写期间,服务器的执行工作
      • 执行客户端的命令
      • 将执行后的写命令追加到AOF缓冲区(保证旧的AOF文件完整)
      • 将执行后的写命令追加到AOF重写缓冲区(用于解决数据不一致问题)

事件

Redis服务器是一个事件驱动程序,服务器处理的事件分为文件事件和时间事件两类

文件事件

  • 文件事件处理器是基于Reactor模式实现的网络通信程序
  • 文件事件处理器使用IO多路复用程序来同时监听多个套接字。并根据套接字目前执行的任务来为套接字关联不同的事件处理器
  • 当被监听的套接字准备好执行连接应答(accept)、读取(read)、写入(write)、关闭(close)时,与操作对应的文件事件就会产生,这时文件事件处理器就会调用套接字之前关联好的事件处理器来处理这些事件。
  • 文件事件是对套接字操作的抽象,每次套接字变为可应答(acceptable)、可写(writeable)或者可读(reable)时,相应的文件事件就会产生
  • 文件事件分为AE_READABLE事件(读事件)和AE_WRITEABLE事件(写事件)两类
image
  • 一次完整的客户端与服务端连接事件示例

    • Redis服务器运行时, 将连接应答处理器与 AE_READABLE事件关联起来

    • 当Redis客户端发起连接时,那么监听套接字将产生AE_READABLE事件,触发连接应答处理器执行。处理跟客户端建立连接,并将客户端套接字的AE_READABLE事件与命令请求处理器关联起来

    • 当客户端向redis发起请求的时候,那么客户端套接字将产生AE_READABLE事件,然后由对应的命令请求处理器来处理。读取客户端的命令内容,并传给相应程序执行。

    • 那么当redis准备好给客户端响应数据之后,服务端会将AE_WRITEABLE事件命令回复处理器关联起来。当客户端准备尝试读取响应数据时,客户端套接字就会产生AE_WRITEABLE事件,触发命令回复处理器执行处理,将准备好的数据返回给客户端。 当回复写完时,服务器就会解除客户端套接字的AE_WRITABLE事件与命令回复处理器之间的关联。

时间事件

  • 时间事件分为定时事件和周期性事件;定时事件只在指定时间到达一次,而周期性事件则每隔一段事件到达一次。

  • 服务器在一般情况下只执行serverCorn函数一个时间事件,并且是周期性的(100ms一次)

    事件实现的三个属性:
    id:时间事件全局ID   ,  when:事件到达时间    timeProc:事件处理函数
    与一个由事件节点构成的无序链表
    

事件的调度与执行

  • 文件事件和时间事件之间是合作关系,服务器会轮流处理这两种事件,并且处理事件过程中不会发生抢占

  • 时间事件的实际处理事件通常会比设定的到达晚一些(因为无法中断文件事件)

  • ServerCron是Redis周期性事件的主要函数。 它的工作主要包括

    • 更新服务器的各类统计信息,如时间,内存占用
    • 清理数据库过期键值对
    • 尝试进行AOF和RDB操作等等

客户端

  • 服务器状态结构使用clients链表表示连接了多少个客户端状态,新添加的客户端状态会被放到链尾

  • 客户端状态flags属性使用不同标志来表示客户端的角色,以及客户端当前所在状态

  • 输入缓冲区记录了客户端发送的命令请求,这个缓冲区大小不超过1GB

  • 客户端使用argv , argc两个属性记录命令的参数和个数 , 而cmd属性记录了客户端要执行命令的实现函数

    image
  • 客户端有固定大小缓冲区和可变大小缓冲区两种, 其中固定大小缓冲区最大大小为16KB , 而可变大小缓冲区(由多个缓冲区组成, 用链表链接)最大大小不能超过服务器设置的硬性限制值

  • 输出缓冲区限制值有两种,如果输出缓冲区的大小超过了服务器设置的硬性限制, 那么客户端会被立即关闭 ; 除此之外 ; 如果客户端在一定时间内,一直超过服务器设置的软性限制,那么客户端也会关闭.

    #设置硬性 , 软性链接
    命令名  客户端角色  硬性链接  软性链接  软性链接时长
    client-output-buffer-limit normal 0 0 0
    client-output-buffer-limit slave 256mb 64mb 60
    client-output-buffer-limit pubsub 32mb 8mb 60
    
  • 客户端关闭的原因 : 网络连接关闭 ; 发送了不合格时的命令请求 ; 成为CLIENT KILL目标 ; 空转时间超时 ; 输出缓冲区的大小超出限制.

服务端

  • 一个命令请求从发送到完成要经历的步骤:
    • 客户端将命令请求发给服务器
    • 服务器读取命令请求,并分析命令参数
    • 命令执行器根据参数查找命令的实现函数,然后执行实现函数并得出命令回复
      • 执行预备操作: 如检验命令的格式 ; 内存是否足够 ; 命令此时是否合法 ; 查看是否开启事务
      • 调用命令实现函数
      • 执行后续操作: 更改统计信息,如耗费时长 ; 如果开启了AOF还要往缓冲区写数据 ; 如果它是master,那么还要将数据同步到从服务器
    • 服务器将命令回复返回给客户端
  • ServerCron函数(每隔100ms执行一次,维护服务器相关资源,并做统计)
    • 更新服务器时间缓存
    • 更新LRU时钟 (空转时间 = LRU时钟 - 某个键上次访问时间 )
    • 更新服务器每秒执行的命令数 (统计吞吐量) ; 更新内存峰值
    • 处理SIGTERM信号(中断信号)
    • 管理数据库资源(检查过期键)
    • 将AOF缓冲区内容写入AOF (每次事件循环时都会做出检查)
  • 服务器从启动到能够处理客户端请求经过的步骤
    • 初始化服务器状态
    • 载入服务器配置
    • 初始化服务器数据结构
    • 还原数据库状态
    • 执行事件循环
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,530评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,403评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,120评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,770评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,758评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,649评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,021评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,675评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,931评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,751评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,410评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,004评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,969评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,042评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,493评论 2 343

推荐阅读更多精彩内容

  • 1.Redis特性 1)速度快:数据存放在内存上、基于C语言实现、单线程架构预防多线程竞争问题;2)基于键值对的数...
    Sponge1128阅读 614评论 0 1
  • 数据库 多数据库结构 一个Redis实例可以支持多个数据库,当客户端与服务端连接并指定到某个数据库时,两者的结构如...
    宇宙最强架构师阅读 607评论 0 3
  • 数据结构部分 字符串(SDS) 数据结构为如下: 优点: 可以以常数复杂度获取字符串的长度,因为记录了字符串的长度...
    良辰美景TT阅读 571评论 0 0
  • 一、数据结构与对象 简单动态字符串(SDS) 相比C字符串增加记录字符串长度的,获取字符串长度复杂度为O(1) 相...
    佐柱阅读 338评论 0 0
  • 基于内存的NoSQL数据库。提供五种数据结构的存储。字符串、列表、集合、有序集合、散列表。Redis 支持很多特性...
    韩绝交阅读 678评论 0 1