创建 Kafka Topic
bin/kafka-topics.sh --zookeeper node01:2181 --create \
--topic golang --partitions 30 --replication-factor 2
注: partitions指定topic分区数,replication-factor指定topic每个分区的副本数
partitions分区数:
- partitions :分区数,控制topic将分片成多少个log。可以显示指定,如果不指定则会使用broker(server.properties)中的num.partitions配置的数量
- 虽然增加分区数可以提供kafka集群的吞吐量、但是过多的分区数或者或是单台服务器上的分区数过多,会增加不可用及延迟的风险。因为多的分区数,意味着需要打开更多的文件句柄、增加点到点的延时、增加客户端的内存消耗。
- 分区数也限制了consumer的并行度,即限制了并行consumer消息的线程数不能大于分区数
- 分区数也限制了producer发送消息是指定的分区。如创建topic时分区设置为1,producer发送消息时通过自定义的分区方法指定分区为2或以上的数都会出错的;这种情况可以通过alter –partitions 来增加分区数。
replication-factor副本
- replication factor 控制消息保存在几个broker(服务器)上,一般情况下等于broker的个数。
- 如果没有在创建时显示指定或通过API向一个不存在的topic生产消息时会使用broker(server.properties)中的default.replication.factor配置的数量
查看group列表
bin/kafka-consumer-groups.sh --bootstrap-server kafka1.irybd.com:9092 \
--groups --list
查看group 的topic 消费情况
$ bin/kafka-consumer-groups.sh --bootstrap-server kafka1.irybd.com:9092 \
--group test-consumer-group --describe
Note: This will not show information about old Zookeeper-based consumers.
Consumer group 'test-consumer-group' has no active members.
TOPIC PARTITION CURRENT-OFFSET LOG-END-OFFSET LAG CONSUMER-ID HOST CLIENT-ID
crawler-media 0 17414248 24371857 6957609 - - -
TOPIC : TOPIC名字
PARTITION: 分区ID
CURRENT-OFFSET: 当前偏移量,目前消费到哪里
LOG-END-OFFSET: 结束偏移量,总共有多少数据
LAG: 还剩多少没有消费