⼤公司的分库分表都是怎么玩的？

当业务规模达到⼀定规模之后，像淘宝⽇订单量在5000万单以上，美团3000万单以上。数据库⾯对海量的数据压⼒，分库分表就是必须进⾏的操作了。⽽分库分表之后⼀些常规的查询可能都会产⽣问题，最常⻅的就是⽐如分⻚查询的问题。⼀般我们把分表的字段称作shardingkey，⽐如订单表按照⽤户ID作为shardingkey，那么如果查询条件中不带⽤户ID查询怎么做分⻚？⼜⽐如更多的多维度的查询都没有shardingkey⼜怎么查询？

唯⼀主键

⼀般我们数据库的主键都是⾃增的，那么分表之后主键冲突的问题就是⼀个⽆法避免的问题，最简单的办法就是以⼀个唯⼀的业务字段作为唯⼀的主键，⽐如订单表的订单号肯定是全局唯⼀的。常⻅的分布式⽣成唯⼀ID的⽅式很多，最常⻅的雪花算法Snowflake、滴滴Tinyid、美团Leaf。以雪花算法举例来说，⼀毫秒可以⽣成4194304多个ID。第⼀位不使⽤，默认都是0，41位时间戳精确到毫秒，可以容纳69年的时间，10位⼯作机器ID⾼5位是数据中⼼ID，低5位是节点ID，12位序列号每个节点每毫秒累加，累计可以达到2^12 4096个ID。

分表

第⼀步，分表后要怎么保证订单号的唯⼀搞定了，现在考虑下分表的问题。⾸先根据⾃身的业务量和增量来考虑分表的⼤⼩。举个例⼦，现在我们⽇单量是10万单，预估⼀年后可以达到⽇100万单，根据业务属性，⼀般我们就⽀持查询半年内的订单，超过半年的订单需要做归档处理。那么以⽇订单100万半年的数量级来看，不分表的话我们订单量将达到100万X180=1.8亿，以这个数据量级部分表的话肯定单表是扛不住的，就算你能扛RT的时间你也根本⽆法接受吧。根据经验单表⼏百万的数量对于数据库是没什么压⼒的，那么只要分256张表就⾜够了，1.8亿/256≈70万，如果为了保险起⻅，也可以分到512张表。那么考虑⼀下，如果业务量再增⻓10倍达到1000万单每天，分表1024就是⽐较合适的选择。通过分表加上超过半年的数据归档之后，单表70万的数据就⾜以应对⼤部分场景了。接下来对订单号hash，然后对256取模的就可以落到具体的哪张表了。

那么，因为唯⼀主键都是以订单号作为依据，以前你写的那些根据主键ID做查询的就不能⽤了，这就涉及到了历史⼀些查询功能的修改。不过这都不是事⼉对吧，都改成以订单号来查就⾏了。这都不是问题，问题在我们的标题说的点上。

C端查询

说了半天，总算到了正题了，那么分表之后查询和分⻚查询的问题怎么解决？⾸先说带shardingkey的查询，⽐如就通过订单号查询，不管你分⻚还是怎么样都是能直接定位到具体的表来查询的，显然查询是不会有什么问题的。如果不是shardingkey的话，上⾯举例说的以订单号作为shardingkey的话，像APP、⼩程序这种⼀般都是通过⽤户ID查询，那这时候我们通过订单号做的sharding怎么办？很多公司订单表直接⽤⽤户ID做shardingkey，那么很简单，直接查就完了。那么订单号怎么办，⼀个很简单的办法就是在订单号上带上⽤户ID的属性。举个很简单的例⼦，原本41位的时间戳你觉得⽤不完，⽤户ID是10位的，订单号的⽣成规则带上⽤户ID，落具体表的时候根据订单号中10位⽤户ID hash取模，这样⽆论根据订单号还是⽤户ID查询效果都是⼀样的。

当然，这种⽅式只是举例，具体的订单号⽣成的规则，多少位，包含哪些因素根据⾃⼰的业务和实现机制来决定。

好，那么⽆论你是订单号还是⽤户ID作为shardingkey，按照以上的两种⽅式都可以解决问题了。那么还有⼀个问题就是如果既不是订单号⼜不是⽤户ID查询怎么办？最直观的例⼦就是来⾃商户端或者后台的查询，商户端都是以商户或者说卖家的ID作为查询条件来查的，后台的查询条件可能就更复杂了，像我碰到的有些后台查询条件能有⼏⼗个，这怎么查？？？别急，接下来分开说B端和后台的复杂查询。现实中真正的流量⼤头都是来⾃于⽤户端C端，所以本质上解决了⽤户端的问题，这个问题就解了⼤半，剩下来⾃商户卖家端B端、后台⽀持运营业务的查询流量并不会很⼤，这个问题就好解。

其他端查询

针对B端的⾮shardingkey的查询有两个办法解决。双写，双写就是下单的数据落两份，C端和B端的各⾃保存⼀份，C端⽤你可以⽤单号、⽤户ID做shardingkey都⾏，B端就⽤商家卖家的ID作为shardingkey就好了。有些同学会说了，你双写不影响性能吗？因为对于B端来说轻微的延迟是可以接受的，所以可以采取异步的⽅式去落B端订单。你想想你去淘宝买个东⻄下单了，卖家稍微延迟个⼀两秒收到这个订单的消息有什么关系吗？你点个外卖商户晚⼀两秒收到这个订单有什么太⼤影响吗？

这是⼀个解决⽅案，另外⼀个⽅案就是⾛离线数仓或者ES查询，订单数据落库之后，不管你通过binlog还是MQ消息的都形式，把数据同步到数仓或者ES，他们⽀持的数量级对于这种查询条件来说就很简单了。同样这种⽅式肯定是稍微有延迟的，但是这种可控范围的延迟是可以接受的。

⽽针对管理后台的查询，⽐如运营、业务、产品需要看数据，他们天然需要复杂的查询条件，同样⾛ES或者数仓都可以做得到。如果不⽤这个⽅案，⼜要不带shardingkey的分⻚查询，兄弟，这就只能扫全表查询聚合数据，然后⼿动做分⻚了，但是这样查出来的结果是有限制的。⽐如你256个⽚，查询的时候循环扫描所有的分⽚，每个⽚取20条数据，最后聚合数据⼿⼯分⻚，那必然是不可能查到全量的数据的。

总结

分库分表后的查询问题，对于有经验的同学来说其实这个问题都知道，但是我相信其实⼤部分同学做的业务可能都没来到这个数量级，分库分表可能都停留在概念阶段，⾯试被问到后就⼿⾜⽆措了，因为没有经验不知道怎么办。分库分表⾸先是基于现有的业务量和未来的增量做出判断，⽐如拼多多这种⽇单量5000万的，半年数据得有百亿级别了，那都得分到4096张表了对吧，但是实际的操作是⼀样的，对于你们的业务分4096那就没有必要了，根据业务做出合理的选择。对于基于shardingkey的查询我们可以很简单的解决，对于⾮shardingkey的查询可以通过落双份数据和数仓、ES的⽅案来解决，当然，如果分表后数据量很⼩的话，建好索引，扫全表查询其实也不是什么问题。

最后编辑于：2022.07.12 23:56:51

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,482评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,377评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,762评论 0赞 342
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,273评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,289评论 5赞 373
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,046评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,351评论 3赞 400
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,988评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,476评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,948评论 2赞 324
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,064评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,712评论 4赞 323
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,261评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,264评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,486评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,511评论 2赞 354
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,802评论 2赞 345

⼤公司的分库分表都是怎么玩的？

唯⼀主键

分表

C端查询

其他端查询

总结

推荐阅读更多精彩内容