读写分离是业务开发中常用的技术手段
本文讲的是在什么业务场景下需要读写分离,读写分离实现的机制
以及实际生产中应用读写分离要注意的问题
什么时候需要读写分离
互联网大部分业务场景都是读多写少的
为了不让数据库的读成为业务瓶颈,同时也为了保证写库的成功率,一般会采用读写分离的技术来保证
读写分离就是分离读库和写库操作
从 CRUD 的角度,主数据库处理新增,修改,删除等事务性操作,而从数据库处理 SELECT 查询操作
具体实现:
- 一主一从,一个主库配置一个从库
- 一主多从,也就是一个主库,但是配置多个从库
读写分离的实现是把访问的压力从主库转移到从库
特别在单机数据库无法支撑并发读写,并且业务请求大部分为读操作的情况下
如果业务特点是写多读少,比如一些需要动态更新的业务场景,应用读写分离就不合适了
由于 MySQL InnoDB 等关系型数据库对事务的支持,一般会选择更高性能的 NoSQL 等存储来实现
MySQL 主从复制技术——binlog 日志
MySQL InnoDB 引擎的主从复制,是通过二进制日志 binlog 来实现
除了数据查询语句 select 以外
binlog 日志记录了其他各类数据写入操作,包括 DDL 和 DML 语句
binlog 有三种格式:Statement,Row 及 Mixed
- Statement 格式,基于 SQL 语句的复制
binlog 会记录每条修改数据的SQL操作,从库拿到后在本地进行回放就可以 - Row 格式,基于行信息复制
Row 格式以行为维度,记录每行数据修改的细节,仅记录行数据的修改
假设有一个批量更新操作,会以行记录的形式保存二进制文件,这样可能会产生大量的日志内容 - Mixed 格式,混合模式复制
Mixed 格式,是 Statement 与 Row 的结合,在这种方式下,不同的 SQL 操作会区别对待
比如一般的数据操作使 row 格式保存,有些表结构的变更语句,使用 statement 来记录
主从复制过程
读写分离要注意的问题
分布式系统通过主从复制实现读写分离
解决了读和写操作的性能瓶颈问题
但同时也增加了整体的复杂性
主从复制下的延时问题
主从复制过程会存在一个延时,当主库有数据写入之后,同时写入 binlog 日志文件中
然后从库通过 binlog 文件同步数据,由于需要额外执行日志同步和写入操作,这期间会有一定时间的延迟
在某些对一致性要求较高的业务场景中,这种主从导致的延迟会引起一些业务问题
比如订单支付,付款已经完成,主库数据更新了,从库还没有
这时候去从库读数据,会出现订单未支付的情况
解决主从同步延迟的问题的方法:
- 敏感业务强制读主库
在开发中有部分业务需要写库后实时读数据,这类操作通常可以通过强制读主库来解决 - 关键业务不进行读写分离
对一致性不敏感的业务,比如电商中的订单评论,个人信息等可以进行读写分离
对一致性要求较高的业务,比如金融支付 ,不进行读写分离,避免延迟导致的问题
主从复制如何避免丢数据
假设在数据库主从同步时,主库宕机,并且数据还没有同步到从库
就会出现数据丢失和不一致的情况
MySQL 数据库主从复制有异步复制,半同步复制和全同步复制的方式
- 异步复制
主库在接受并处理客户端的写入请求时,直接返回执行结果,不关心从库同步是否成功
主库崩溃以后,可能有部分操作没有同步到从库,出现数据丢失问题 - 半同步复制
主库需要等待至少一个从库完成同步之后,才完成写操作
主库在执行完客户端提交的事务后,从库将日志写入自己本地的 relay log 之后
会返回一个响应结果给主库,主库确认从库已经同步完成,才会结束本次操作
半同步复制提高了数据的安全性,避免了主库崩溃出现的数据丢失,但同时也增加了主库写操作的耗时 - 全同步复制
全同步复制指的是在多从库的情况下,当主库执行完一个事务
需要等待所有的从库都同步完成以后,才完成本次写操作
全同步复制需要等待所有从库执行完对应的事务,所以整体性能是最差的
总结
本文分享了读写分离的业务场景,MySQL 的主从复制技术
包括 binlog 的应用,主从复制的延时问题,数据库同步的不同机制
读写分离只是分布式性能优化的一个手段,不是任务读性能瓶颈都需要使用读写分离
还可以进行分库分表,以及利用缓存,文件索引等 NoSQL 数据库来提高性能