Kafka Connect之Canal

Canal介绍及其原理，多谢博主的共享，对Canal和MaxWell的区别瞬间懂了很多。

1.Canal和Maxwell作为kafka source的区别

阿里开源的Canal进行Mysql binlog数据的抽取，另需开发一个数据转换工具将从binlog中解析出的数据转换成自带schema的json数据并写入kafka中。而使用maxwell可直接完成对mysql binlog数据的抽取和转换成自带schema的json数据写入到kafka中。

另外Maxwell作为kafka connector的话需要metric的东西也比较多，因此此处我的kafka Connect选择了Canal.

2.Canal -> kafka的实现

像1中所说的实现Canal作为kafka的生产者，kafka作为消费者，还需要一个中间件。github上有给出这个，地址：https://github.com/sasou/syncClient
以下为运行步骤：

首先配置Canal，下载deploy的tar包，可单机环境。下载解压后进行如下配置
$ vim [Canal path]/conf/example/instance.properties
修改如下一行
canal.instance.master.journal.name = mysql-bin.000001 #mysql主库链接时起始的binlog文件
canal.instance.master.position = 4 #mysql主库链接时起始的binlog偏移量，可不设置
canal.instance.defaultDatabaseName = test #mysql链接时默认schema,选择一个你的mysql中存在的数据库
开启mysql的binlog写入功能，并且配置binlog模式为row

canal的原理是基于mysql binlog技术，所以这里一定需要开启mysql的binlog写入功能，并且配置binlog模式为row.
$ vim /etc/mysql/my.cnf
[mysqld]
log-bin=mysql-bin #添加这一行就ok    
binlog-format=ROW #选择row模式    
server_id=1 #配置mysql replaction需要定义，不能和canal的slaveId重复 

注意完成后一定要重启mysql服务
$ service mysql stop
$ service mysql start

在mysql中添加Canal用户的权限
canal的原理是模拟自己为mysql slave，所以这里一定需要做为mysql slave的相关权限
在mysql>下输入：

CREATE USER canal IDENTIFIED BY 'canal';      
GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'canal'@'%';
GRANT SELECT,REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO canal[@localhost];
FLUSH PRIVILEGES;

针对已有的账户可通过grants查询权限：
show grants **for** 'canal';

下载github上的syncClient
下载并解压缩数据实时同步中间件syncClient。
根据自身情况修改/syncClient/bin/SysConfig.properties
比如我运行的是canal的实例是example，且kafka在本地，所以进行了如下修改：

debug=1
ip=127.0.0.1
port=11111
destination=example
username=
password=
filter=

#kafka
kafkaIp=127.0.0.1
kafkaPort=9092

注意这里的username，password和canal配置中的dbusername,dbpassword的区别。Canal配置中的dbusername,dbpassword是指canal读取mysql的binlog时的用户和密码，默认是canal,canal。但是这里的username和password是指canal自身的用户和密码（即连接到这个数据实时同步中间件时的用户和密码），默认是空。
之后在bin目录下运行
sh start.sh即可看到
empty 0
empty 1
……
这样的输出

传入数据
开启kafka,并启动另一个终端对mysql中对数据库中的表做修改（至于是不是必须是我们之前设置的canal.instance.defaultDatabaseName = test这个test数据库，还待进一步验证），修改后就可以在start.sh那个终端下看到变化了。如果有错误，请尝试关闭防火墙$ sudo ufw stop
使用kafka查看变化
如果想使用kafka查看数据库的变化，可以在启动消费者端查看
$ cd [the path to kafka]
$ bin/kafka-console-consumer.sh -zookeeper localhost:2181--from-beginning --topic 数据库名_表名 #比如你修改的是test数据下的user表，则此处topic为test_user
当然你也可以在kafka中查看是否有这个topic
bin/kafka-topics.sh --list --zookeeper localhost:2181
以上就是今天的全部工作了~Fighting

最后编辑于：2017.12.10 03:41:01

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,530评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 86,403评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,120评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,770评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,758评论 5赞 367
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,649评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,021评论 3赞 398
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,675评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,931评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,659评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,751评论 1赞 330
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,410评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,004评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,969评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,203评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,042评论 2赞 350
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,493评论 2赞 343

Kafka Connect之Canal

1.Canal和Maxwell作为kafka source的区别

2.Canal -> kafka的实现

推荐阅读更多精彩内容