从单机定时到多层分发

在工作中基本上都会使用定时任务，常用的有 Spring 定时框架、Quartz、elastic-job、xxl-job 等。这里说不上框架的好坏，只有适合自己的才是最好的，本文仅从个人角度上谈一谈对定时任务的看法。

单机定时

单机定时我这里分为 纯单机版 、 固定 IP 版 、 分布式锁版 、 单机调度版 ，下面从这四个角度来谈一谈他们的实现方式以及当时所在的背景。

纯单机版

顾名思义，就是应用都是单体应用，不存在集群，写一个定时任务就可以了，可以是线程定时调度、也可以是 Spring 定时框架用 @Scheduled 注解实现。这种方式在单体应用的极为合适，主要是简单方便。

当然也存在他的弊端，那就是如果我的应用是多机部署的，那就会导致并发冲突。出现问题，解决问题，所以下面三种方式应运而生。

固定 IP 版

就是如果我知道了机器的 IP 地址，并且基本上 IP 地址也不会变化，我只需要在代码中写一个判断逻辑，这样 IP 地址不是当前机器的应用，并不会执行定时任务。

大概逻辑如下：

<pre class="prettyprint hljs java" style="padding: 0.5em; font-family: Menlo, Monaco, Consolas, "Courier New", monospace; color: rgb(68, 68, 68); border-radius: 4px; display: block; margin: 0px 0px 1.5em; font-size: 14px; line-height: 1.5em; word-break: break-all; overflow-wrap: break-word; white-space: pre; background-color: rgb(246, 246, 246); border: none; overflow-x: auto; font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; orphans: 2; text-align: start; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-thickness: initial; text-decoration-style: initial; text-decoration-color: initial;">@Component
public class ScheduledTask {

@Scheduled(cron="0 0 * * * ? *")
public void execute() {
    // 获取当前机器的 IP 地址
    // 比较配置的 IP 地址和当前机器的 IP 地址是否相同
    // 不相同直接返回
    // 相同则继续执行定时任务
}

}</pre>

这种方式可以很完美的避免多台机器同时执行定时任务，也可以稍微进阶一下，就是将指定的 IP 地址用 @Value 注解，然后可以在配置中心比如 Apollo 进行动态修改。

分布式锁版

这种和上面的方式区别不大，只是在中间尝试获取分布式锁，不过需要对分布式锁的时间把握好，一般问题不大，如果一天一次的定时任务，在 Redis 锁它个一天都可以，总不能定时任务也执行一天。当然几分钟一次的也一个意思，合理安排锁的时间就行。在数据库写个标识也可以，都是大同小异。

@Scheduled(cron="0 0 0 * * ? *")
public void execute() {
    // 尝试获取分布式锁
    // 获取锁失败，说明别的机器在执行定时任务，直接返回
    // 获取锁成功，在本机执行定时任务
}

}</pre>

单机调度版

这种方式也很容易理解，定时执行的任务，也是一个接口，我定时去调度一下这个接口就行了。

[图片上传失败...(image-be4767-1649503645129)]

这种方式是完全可以的，定时系统用 Spring 定时框架定时执行，定时系统是单机的，不存在并发，调度到业务系统，可以使用 Dubbo，这里只会有一台机器被调度到。

至于说重复调度了这种极端情况那就另说，不过像查单、补单这种基本不会有啥问题，做个幂等就行。

这种情况也存在弊端，就是定时系统是单机的，如果他挂了怎么办？不用怕，技术还可以继续演进！

分布式调度中间件

单机执行版

分布式调度中间件，我相对熟悉一些的就是 xxl-job。图和上面定是系统调度版本区别不大，一般常用的就是将调度任务发到一台机器来执行。基本上使用的都是这种方式，能解决大部分的场景，但是依然存在问题，毕竟咱们的主题是多层分发。

<pre class="prettyprint hljs less" style="padding: 0.5em; font-family: Menlo, Monaco, Consolas, "Courier New", monospace; color: rgb(68, 68, 68); border-radius: 4px; display: block; margin: 0px 0px 1.5em; font-size: 14px; line-height: 1.5em; word-break: break-all; overflow-wrap: break-word; white-space: pre; background-color: rgb(246, 246, 246); border: none; overflow-x: auto; font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; orphans: 2; text-align: start; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-thickness: initial; text-decoration-style: initial; text-decoration-color: initial;">@Component
@JobHandler("demoJob")
@Slf4j
public class DemoJob extends IJobHandler {

@Override
public ReturnT<String> execute(String param) throws Exception {

    log.info("XXJob 收到调度 ...");

    try {
    } catch (Exception e) {
        log.info("XXJob 调度异常:", e);
        return FAIL;
    }
    return SUCCESS;
}

}</pre>

如果我是定时查单，并且 TPS 不是很高的情况下，问题不大，毕竟每分钟改的单量，定时还是可以查的过来的。但是如果换成基金发息或者账务对账那就大不一样了。

因为单机执行定时调度，会花费很久，像基金需要知道昨日金额等等，账务需要对用户交易计算。结果就是可能一个定时任务执行四五个小时，当然一天也有可能。四五个小时还好，毕竟我今天能出结果，如果一天，我今天的还没算完，明天的交易又来了，并且这个时效性也太差了。

所以就用到了 xxl-job 的 分片广播 & 动态分片 功能。

分片广播

[图片上传失败...(image-a8d490-1649503645129)]

在分片广播场景下，xxl-job 会对当前定时中所有注册的应用发起调度。

按照文档可以使用下面的方式获取当前机器的 shardIndex 和 shardTotal。

:point_right|type_1_2: 文档地址

<pre class="prettyprint hljs verilog" style="padding: 0.5em; font-family: Menlo, Monaco, Consolas, "Courier New", monospace; color: rgb(68, 68, 68); border-radius: 4px; display: block; margin: 0px 0px 1.5em; font-size: 14px; line-height: 1.5em; word-break: break-all; overflow-wrap: break-word; white-space: pre; background-color: rgb(246, 246, 246); border: none; overflow-x: auto; font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; orphans: 2; text-align: start; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-thickness: initial; text-decoration-style: initial; text-decoration-color: initial;">// 可参考Sample示例执行器中的示例任务"ShardingJobHandler"了解试用
int shardIndex = XxlJobHelper.getShardIndex();
int shardTotal = XxlJobHelper.getShardTotal();</pre>

有人问这种有什么用呢？可以想一下，本来是由单机执行的定时任务，现在变成集群每台机器来执行一部分，这不是充分利用了集群的特征了么？

具体一点可以是：

按照 user_id 取模，然后每台机器只执行某些特定用户的定时统计
分库分表场景下，一台机器执行一个库的数据统计

多层分发

就像面试题肯定会层层剖析，这时候肯定会问如果发生数据倾斜了怎么办？

具体现象就是如果按照用户来分配机器，取模等于 0 的用户在 shardIndex0 上执行定时，但是这些用户的总交易量占据了 90% 以上，那就会导致另几台的定时咔咔咔一会执行完了，这太机器还在吭哧吭哧的干。那不就没啥用了么？

[图片上传失败...(image-df3d56-1649503645128)]

上图只是分发了三层：

第一层仅有一台机器收到调度，然后获取所有任务，可以是多少个库，也可以是有多少数据，然后发起 RPC 调用本集群的接口，说你们每次执行这些
第二层收到调度，再按照其他维度再分割一次，比如第一次按照用户来分的，第二次则查出来订单，按照订单再分，然后再发送 RPC 调用集群执行接口
第三层收到被执行的订单，开始执行具体的任务

理论上是可以多层分发的，最终结果就是让每台机器均匀的执行定时任务，这样可以充分利用每台机器的能力。

总结

其实这个问题是我曾经遇到的面试题，当时还和群友讨论了很久。在实际工作中，这几种也并没有好坏之差，只要适合自己，就够了。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,793评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,567评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,342评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,825评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,814评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,680评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,033评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,687评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 42,175评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,668评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,775评论 1赞 332
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,419评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,020评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,978评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,206评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,092评论 2赞 351
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,510评论 2赞 343

从单机定时到多层分发

单机定时

纯单机版

固定 IP 版

分布式锁版

单机调度版

分布式调度中间件

单机执行版

分片广播

多层分发

总结

推荐阅读更多精彩内容