Flink1.12 SQL连接器之JDBC Connector介绍与使用总结

前言

与DataStream同样，官方在Flink SQL上也提供了很多连接器，今天来学习总结一下JDBC连接器

环境准备

如果使用编码，需要引入两个依赖包，Flink提供的jdbc连接器依赖和和对应的mysql驱动包，

以下为1.12.0 提供的jdbc连接器依赖

<dependency>
  <groupId>org.apache.flink</groupId>
  <artifactId>flink-connector-jdbc_2.11</artifactId>
  <version>1.12.0</version>
</dependency>

mysql依赖下载地址

使用学习

The JDBC sink operate in upsert mode for exchange UPDATE/DELETE messages with the external system if a primary key is defined on the DDL, otherwise, it operates in append mode and doesn’t support to consume UPDATE/DELETE messages.

来自官网的一段介绍，简单翻译一下就是说，如果DDL上定义了主键，则JDBC接收器以upsert模式操作与外部系统交互，否则以append模型来进行交互。

本人测试了一下，详细步骤就不写了，和官网差不多，测试主要步骤如下：

外部数据库DDL设置主键，Flink SQL DDL设置主键

外部数据库DDL不设置主键，Flink SQL DDL设置主键

外部数据库DDL设置主键，Flink SQL DDL不设置主键

外部数据库DDL不设置主键，Flink SQL DDL不设置主键

结果如下：

	外部系统DDL有主键	外部系统DDL无主键
Flink SQL DDL 有主键	upsert	append
Flink SQL DDL 无主键	upsert	append

总结：JDBC sink的操作时，如果外部系统定义的DDL存在主键，则JDBC连接器将使用upsert语义而不是简单的insert，在Flink任务执行中如果出现了故障，Flink作业将会从上一个成功的检查点恢复并重新处理，这可能导致在恢复期间重新处理消息。

强烈建议使用upsert模式，因为使用append模式需要重新处理记录，下游可能会出现重复数据。

重要特性

Partitioned Scan

为了加速并行Source任务实例中的数据读取，Flink 在JDBC连接器中提供了scan.partition.column，scan.partition.num，scan.partition.lower-bound，scan.partition.upper-bound 这4个配置属性。其原理简单解释一下：

如果一个线程去读一张很大的表，从头读到尾，肯定很慢，如果想加快速度，自然能想到使用多线程。如何使用呢？

比如假设有id为0到100的数据，id不连续，并且实际上有50条记录，如果我们希望分而治之，那么最好是五个线程，每个线程读取10条数据。但是肯定是做不到这么精确的。最简单的办法是，产生五条如下的SQL：

select * from xxx where id<20;
select * from xxx where id>=20 and id <40;
select * from xxx where id>=40 and id <60;
select * from xxx where id>=60 and id <80;
select * from xxx where id>=80;

因为id中间有空隙，所以每条SQL实际拿到的数据并不一样。但没关系，通过五个线程执行这五条SQL，我们肯定可以通过更少的时间获取到全量数据。

所以在分区扫描中，确定了4个属性规则，用来并行的读这些数据

scan.partition.column：按照哪个列进行分区

scan.partition.num：分区数量

scan.partition.lower-bound：分区字段的最小值

scan.partition.upper-bound：分区字段的最大值

这个其实和之前博客中写的过优化SQL方法原理是一样的，链接请看：

SQL优化之使用数学的方式动态的确定区间并统计02

简单来说就是，如果这个比如这样（...,20）,[20,40),[40,60),[60,80)....[80,...) 。少还可以，如果面对上百组的情况，后续不容易维护，比如上面的例子，第一组的最小值是20,最后一组的最大值是80,然后总共5组，这样Flink就知道20-80之间还要再分三组。

目前Flink 支持数字，日期，时间戳等类型的分区扫描配置。

Lookup Cache

JDBC连接器在作为Source维度表使用时，可以开启缓存来提高临时连接JDBC连接器的性能。

默认情况下，不启用查找缓存，因此所有请求都发送到外部数据库。启用查找缓存后，每个进程（即TaskManager）将保存一个缓存。Flink将首先查找缓存，并且仅在缺少缓存时才将请求发送到外部数据库，并使用返回的行更新缓存。当缓存达到最大缓存行数lookup.cache.max-rows或超过最大生存时间时，缓存中最旧的行将过期lookup.cache.ttl。缓存的行可能不是最新的，用户可以调整lookup.cache.ttl为较小的值以获取更好的新鲜数据，但这可能会增加发送到数据库的请求的数量。因此，这是吞吐量和正确性之间的平衡。

lookup.max-retries则配置在查询失败后重试的次数

Buffer-flush

当mysql被使用被Sink时，可以配置

sink.buffer-flush.max-rows ：配置刷新前缓冲记录的最大大小

sink.buffer-flush.interval ：配置刷新间隔，单位为毫秒，在此期间，异步线程将刷新数据。可以设置为'0'来禁用它。注意,”sink.buffer-flush.max-rows'可以设置为'0'，并设置刷新间隔，以允许完成异步处理缓冲的动作。

总结

本文是本文学习和使用Flink SQL JDBC 连接器的学习笔记和总结，如果出现描述问题，欢迎大家留言指出，一起努力。

-- by 两只猴

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,602评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,442评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,878评论 0赞 344
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,306评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,330评论 5赞 373
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,071评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,382评论 3赞 400
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,006评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,512评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,965评论 2赞 325
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,094评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,732评论 4赞 323
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,283评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,286评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,512评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,536评论 2赞 354
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,828评论 2赞 345