京东一面：MySQL 主备延迟有哪些坑？主备切换策略

大家好，我是Tom哥

作为一名开发同学，大家对 MySQL 一定不陌生，像常见的 事务特性、隔离级别 、索引等也都是老生常谈。

今天，我们就来聊个深度话题，关于 MySQL 的 高可用

一、什么是高可用？

维基百科定义：

高可用性（high availability，缩写 HA），指系统无中断地执行其功能的能力，代表系统的可用性程度。高可用性通常通过提高系统的容错能力来实现。

MySQL 的高可用是如何实现的呢？

首先，我们来看张图

过程：

开始时，处理流程主要是 场景一
客户端读、写，访问的是主库
主库通过某种机制，将数据实时同步给备库
当主库突然发生故障（如：磁盘损坏等），无法正常响应客户端的请求。此时会自动主备切换，进入 场景二
客户端读写，访问的是备库（此时备库升级为新主库）

看似天衣无缝，那是不是可以高枕无忧了呢？？？兄弟，想多了

主备切换，确实能满足高可用。但有个前提，主备库的数据要同步。

不过，数据同步是个异步操作，不可能做到实时，所以说主备延迟是一定存在的

二、什么是主备延迟？

主库完成一个事务，写入binlog。binlog 中有一个时间字段，用于记录主库写入的时间【时刻 t1】
binlog 同步给备库，备库接收并存储到中继日志【时刻 t2】
备库SQL执行线程执行binlog，数据写入到备库表中【时刻 t3】

主备延迟时间计算公式：

t3 - t1

有没有简单命令，直接查看。在备库执行 show slave status 命令

seconds_behind_master，表示当前备库延迟了多少秒

心细的同学会有疑问了， t3 和 t1 分属于两台机器，如果时钟不一致怎么办？

初始化时，备库连接到主库，会执行 SELECT UNIX_TIMESTAMP() 来获得当前主库的系统时间。

如果发现主库的系统时间与备库不一致，备库在计算 seconds_behind_master 会自动减掉这个差值。

注意：

binlog 数据传输的时间（t2 - t1）非常短，可以忽略。主要延迟花费在备库执行binlog日志

三、`主备延迟`常见原因

1、备库机器配置差

这个不难理解，“门当户对”、“志同道合”，如果主备机器的性能差别大，直接导致备库的同步速度跟不上主库的生产节奏。

就像跑步一样，落后差距会越来越大。

解决方案：

1、升级备库的机器配置

2、备库干私活

备库除了服务于正常的读业务外，是否有被其他特殊业务征用，如：运营数据统计等，这类操作非常消耗系统资源，也会影响数据同步速度。

解决方案：

可以借助大数据平台，数据异构，满足各种这些特殊的统计类查询。

3、大事务

我们知道 binglog 是在事务提交时才生成的。

如果是处理大事务，执行时间比较长（比如 5分钟）。虽然备库很快拿到 binlog，但是在备库回放执行也要花费差不多的时间，也要 5分钟（备库中，只有这个事务执行完提交，备库才真正对外可见），从而导致主备延迟很大。

比如 delete 操作，慎用 delete from 表名，建议采用分批删除，减少大事务。

四、主库不可用，主备切换有哪些策略？

1、可靠优先

当主库A 发生故障不可用时，开始进入主备切换

首先，判断 B库 seconds_behind_master 是否小于设定的阈值（比如 4 秒），如果满足条件
将 A库改为只读状态，将 readonly 设置为 true。断掉 A 库的写入操作，保证不会有新的写流量进来
判断 B库的 seconds_behind_master ，直到为 0
修改 B库为 读、写状态
客户端的请求打到 B库

此时，主备切换完成。

优点：

数据不会丢失，所以我们称为可靠性高

缺点：

中间有个阶段，A库和B库都是只读状态，此时系统对外不能提供写服务。

2、可用优先

当然我们也可以不用等主备数据同步完成，在一开始时就直接将流量切到备库。

这样备库的流量就可能有两个来源：

主库之前的剩余流量 binlog
客户端新请求进来的流量

两部分流量冲击，会对 数据一致性 造成一些影响。

我们来做个实验：

首次创建一个用户表：

CREATE TABLE `person` (
  `id`  bigint(20) unsigned  NOT NULL AUTO_INCREMENT,
  `name` varchar(32) ,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;

插入2条记录

insert into person(name) values ("tom");
insert into person(name) values ("jerry");

实验一：

将 binlog 的格式设为 binlog_format=row

说明：row 模式，写 binlog 时会记录所有字段的值

库A 、库B 在做数据同步时，都会报主键冲突，最后只有一行数据不一致，但是会丢数据。

优点：同步过程中，出现问题能够及时发现。

实验二：

将 binlog 格式设置为 statement 或者 mixed

按照 SQL 原始语句同步 binlog，可以看到，数据条数不会少，但是主键id会出现混乱。

3、结论

本着 "攘外必先安内" ，保证内部的数据的正确性是我们的首选。所以，一般建议大家选择 可靠优先。

但是可靠优先可能会导致一定时间内，数据库不可用。这个时间值取决于主备延迟的时间大小。

所以，我们应尽可能缩短主备库的延迟时间大小，这样一旦主库发生故障，备库才会更快的同步完数据，主备切换才能完成，服务才能更快恢复。

关于我：

Tom哥，计算机研究生，校招进阿里，期间还拿了百度、华为、中兴、腾讯 等6家大厂offer，P7 技术专家。出过专利，CSDN博客专家。

多年的大厂浸染，参加多次淘宝双11大促活动，在系统架构方面有丰富经验，沉淀总结在微信公众号：微观技术

他专注于微服务、高并发、高性能缓存、分布式架构、高可用、团队管理等方面，喜欢挖掘开源框架亮点设计，内容都是面试官喜欢考察的。强烈推荐关注一波。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,271评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,275评论 2赞 380
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,151评论 0赞 336
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,550评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,553评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,559评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,924评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,580评论 0赞 257
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,826评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,578评论 2赞 320
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,661评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,363评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,940评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,926评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,156评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,872评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,391评论 2赞 342

京东一面：MySQL 主备延迟有哪些坑？主备切换策略

一、什么是高可用？

二、什么是主备延迟？

三、主备延迟常见原因

四、主库不可用，主备切换有哪些策略？

推荐阅读更多精彩内容

三、`主备延迟`常见原因