如何快速使用docker部署kafka及python中的应用

快速使用docker部署kafka

1.安装Docker及docker-compose

2.镜像准备

sudo docker pull wurstmeister/zookeeper
sudo docker pull wurstmeister/kafka 
sudo docker pull sheepkiller/kafka-manager # 这个不需要可以去掉，主要可用于图形管理页面

3.编写docker-compose文件

由于主要是用于理解kafka的命令及python中如何应用，所以这里暂时没有集群部署的方式

version: '2'
services:
  zookeeper:
    image: wurstmeister/zookeeper
    volumes:
      - ./kafka_data/data:/data
    ports:
      - "2181:2181"
  kafka:
    image: wurstmeister/kafka
    # 设置多brokers时，可不指定宿主机端口，会自动分配，但有报错，具体原因未知
    ports:
      - "9092:9092"
    environment:
      KAFKA_ADVERTISED_HOST_NAME: 192.168.101.128
     # 单个消息的最大限制，目前大约是2M
      KAFKA_MESSAGE_MAX_BYTES: 2000000
     # 初始化创建的topic，可以不设置
     # KAFKA_CREATE_TOPICS: "Topic1:1:3,Topic2:1:1:compact" 
      KAFKA_ZOOKEEPER_CONNECT: zookeeper:2181
    volumes:
      - ./kafka_data/kafka-logs:/kafka
      - /var/run/docker.sock:/var/run/docker.sock
  # 如果不需要可以把这里注释掉
  kafka-manager:
    image: sheepkiller/kafka-manager
    ports:
      - 9020:9000
    environment:
      ZK_HOSTS: zookeeper:2181

4.启动kafka

sudo docker-compose up -d

5.创建topic

查看容器列表，找到kafka的容器ID或者名称

sudo docker ps -a

如果不加-a，只能看到启动状态的所有容器信息

执行下面命令，进入容器内部

sudo docker exec -it b6758761234a /bin/bash

在容器内部执行下面命令

这样即可创建一个名为testtopic的topic，分区数为2，副本数为1

bash-5.1# kafka-topics.sh --create --topic testtopic --partitions 2 --zookeeper zookeeper:2181 --replication-factor 1

6.producer向topic发送消息

producer发送消息分为无key型消息和有key型消息，默认是无key型

发送无key型消息

bash-5.1# kafka-console-producer.sh --broker-list 192.168.101.128:9092 --topic testtopic
>hello

发送有key型消息

下面key为hello，value为world，key与value之间用tab间隔

bash-5.1# kafka-console-producer.sh --broker-list 192.168.101.128:9092 --topic testtopic --property parse.key=true
>hello  world

7.consumer从topic读取消息

bash-5.1# kafka-console-consumer.sh --bootstrap-server 192.168.101.128:9092 --topic testtopic --property print.key=true --from-beginning
null    hello 
null    aaa:122
null    {"wqwq":123}
hello   world

--from-beginning 表示从存在的最早消息开始读取
--property print.key=true 表示输出key和value，如果没有key则为null

kafka在python中的应用

Consumergroup

允许consumer group（包含多个consumer，如一个集群同时消费）对一个topic进行消费，不同的consumer group之间独立消费。
为了对减小一个consumer group中不同consumer之间的分布式协调开销，指定partition为最小的并行消费单位，即一个group内的consumer只能消费不同的partition。
可以在容器内部创建一个组消费者，下面定义为test

bash-5.1# kafka-console-consumer.sh --bootstrap-server 192.168.101.128:9092 --topic testtopic --group test

可以在容器内部创建一个非组消费者

bash-5.1# kafka-console-consumer.sh --bootstrap-server 192.168.101.128:9092 --topic testtopic

在python下创建两个文件分别为prod.py和con.py

1.创建生产者prod.py

import json
import traceback

from kafka import KafkaProducer
from kafka.errors import kafka_errors

bootstrap_servers = ['192.168.101.128:9092']
topic = 'testtopic'

producer = KafkaProducer(bootstrap_servers=bootstrap_servers, key_serializer=lambda k: json.dumps(k).encode(),
                         value_serializer=lambda v: json.dumps(v).encode())
for i in range(0, 3):
    future = producer.send(
        topic,
        key='count_num',  # 同一个key值，会被送至同一个分区
        value=str(i),
        partition=1)  # 向分区1发送消息
    print("send {}".format(str(i)))
    try:
        future.get(timeout=10)  # 监控是否发送成功
    except kafka_errors:  # 发送失败抛出kafka_errors
        traceback.format_exc()

2.创建消费者con.py

import json

from kafka import KafkaConsumer

bootstrap_servers = ['192.168.101.128:9092']
topic = 'testtopic'

consumer = KafkaConsumer(
    topic,
    bootstrap_servers=bootstrap_servers,
    group_id='test'
)
for message in consumer:
    print("receive, key: {}, value: {}".format(
        json.loads(message.key.decode()),
        json.loads(message.value.decode())))

3.执行消费者con.py
此时容器内部有两个消费者，再加上con.py就一共有三个消费者，其中有两个是组消费者，组id为test，还有一个非组消费者，再执行prod.py

容器中的非组消费者，也消费了这个消息

bash-5.1# kafka-console-consumer.sh --bootstrap-server 192.168.101.128:9092 --topic testtopic --property print.key=true
"count_num" "0"
"count_num" "1"
"count_num" "2"

con.py的组消费者，消费了这个消息

E:\PycharmProjects\scripts\venv\Scripts\python.exe E:/PycharmProjects/scripts/kafka_test/consumer_kafka.py
receive, key: count_num, value: 0
receive, key: count_num, value: 1
receive, key: count_num, value: 2

容器中的组消费者，没有执行

bash-5.1# kafka-console-consumer.sh --bootstrap-server 192.168.101.128:9092 --topic testtopic --group test

综上印证了，前面Consumergroup中说到的，如果没有组id，那么每个topic的消息，会被多个消费者重复消费，类似我在过往的python和rabbitmq中的遇到的问题，消费者端是采用gunicorn开了4个worker，所以当生产者一条消息发出，消费者却执行了四次，当使用了groupid就可以保证一条消息只被这个group中的一个消费者消费，如果需要多个消费者消费，可以创建多个group

参考

最后编辑于：2021.07.20 21:33:45

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 194,088评论 5赞 459
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 81,715评论 2赞 371
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 141,361评论 0赞 319
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 52,099评论 1赞 263
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 60,987评论 4赞 355
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 46,063评论 1赞 272
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 36,486评论 3赞 381
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 35,175评论 0赞 253
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 39,440评论 1赞 290
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 34,518评论 2赞 309
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 36,305评论 1赞 326
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 32,190评论 3赞 312
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 37,550评论 3赞 298
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 28,880评论 0赞 17
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 30,152评论 1赞 250
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 41,451评论 2赞 341
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 40,637评论 2赞 335