1、名词解析:
broker: 一个Kafka节点就是一个broker,多个broker可以组成一个Kafka集群。
topic: 主题 ,代表一类消息
partition:topic物理上的分组,一个topic可以分为多个partition,每个partition是一个有序的队列。每个partition都对应唯一的消费者!!!
offset:每个partition都由一系列有序的、不可变的消息组成,这些消息被连续的追加到partition中。partition中的每个消息都有一个连续的序列号叫做offset,用于partition唯一标识一条消息.同一个partition的offset是被顺序消费的
topic和partition以及offset关系如图所示
2、kafka的log存储解析
参考资料:https://blog.csdn.net/jewes/article/details/42970799
segment index file采取稀疏索引存储方式,它减少索引文件大小,通过mmap可以直接内存操作,稀疏索引为数据文件的每个对应message设置一个元数据指针,它比稠密索引节省了更多的存储空间,但查找起来需要消耗更多的时间(但此时每块的数据量少的多,查找起来快)。
2、Kafka集群partitions/replicas默认分配解析
集群partitions/replicas默认分配
参考资料:https://blog.csdn.net/lizhitao/article/details/41778193