主从同步流程(全量)
- slave与master建立socket连接;
- slave向master发送PSYNC命令请求复制数据(无论slave是否为第一次连接);
- master收到PSYNC命令后,会在后台进行数据持久化;
- 通过bgsave生成最新的rdb快照文件
- bgsave期间,将客户端发送的命令(会修改数据集的)缓存到内存中;
- 持久化完毕后,master将这份RDB数据发送给slave;
- slave会把接收到的数据进行持久化生成RDB,然后再加载到内存中。
- master继续将之前缓存在内存中的命令发送给slave。
需要注意的是,master与slave之间的连接由于某些原因断开后,slave能够自动重连master,master收到了多个slave并发连接请求,他只会进行一次持久化,而不是一个连接一次,然后再把这一份持久化的数据发送给多个并发连接的slave。
主从复制(全量复制)流程图如下:
数据部分复制(断点续传)
当master与slave断开连接重连后,在redis2.8版本以前,会重新进行全量复制,在2.8版本开始,redis改用可以只吃部分数据复制的命令PSYNC去master同步数据,slave与master能够在网络连接断开后只进行部分数据复制(断点续传)。
master会在其内存中创建一个复制数据用的缓存队列,缓存最近一段时间的数据,master和它所有的slave都维护了复制和数据下标offset和master的进程id,因此当网络连接断开后,slave会请求master继续进行未完成的复制,从所记录的数据下标开始。如果master进程节点id变化,或者从节点数据下表offset太久,已经不再master的缓存队列里,则会进行一次全量数据复制。
主从复制(部分复制、断点续传)流程图:
如果有很多从节点,为了缓解主从复制风暴(多个从节点同事复制主节点导致主节点压力过大),可以做如下架构,让部分从节点与从节点同步数据。