Kafka权威指南第2版学习笔记--Kafka生产者:写消息到Kafka

kafka权威指南第二版(登峰大数据)

第2章安装kafka

本章介绍Apache Kafka broker的入门知识，包括如何搭建Apache ZooKeeper集群, Kafka使用ZooKeeper为broker存储元数据。本章还将涵盖Kafka部署的基本配置项，以及选择运行broker的硬件的一些建议。最后，介绍如何安装多个Kafka broker作为集群的一部分，以及在生产环境中使用Kafka时应该知道的事情。

2.1 环境配置

在使用Apache Kafka之前，有一些先决条件(配置环境)，以确保它正常运行。下面几节将指导您完成这个过程。

2.1.1 选择操作系统

Apache Kafka是一个Java应用程序，可以在许多操作系统上运行。虽然Kafka能够运行在许多操作系统上，包括Windows, macOS, Linux等，Linux是一般用例的推荐操作系统。本章的安装步骤将重点介绍在Linux环境中安装和使用Kafka。关于在Windows和macOS上安装Kafka的详细信息请参见附录A。

2.1.2 安装Java

在安装ZooKeeper或Kafka之前，需要配置一个Java环境。 Kafka和ZooKeeper可以兼容所有基于openjdk的Java实现，包括Oracle JDK。 Kafka的最新版本同时支持Java 8和Java 11。安装的确切版本可以是操作系统提供的版本，也可以是直接从网络下载的版本(例如，从Oracle网站下载的Oracle版本JDK)。尽管ZooKeeper和Kafka将与Java运行时(JRE)一起工作，但在开发工具和应用程序时，建议使用完整的Java开发工具包(JDK)。建议安装Java环境的最新发布补丁版本，因为旧版本可能存在安全漏洞。本章示例安装步骤假设已经安装了JDK版本11 update 10(在/usr/java/jdk-11.0.10目录)。

2.1.3 安装ZooKeeper

Apache Kafka使用Apache ZooKeeper存储Kafka集群的元数据，以及消费者客户端的详细信息，如图2-1所示。 ZooKeeper是一种集中式服务，提供维护配置信息、命名、分布式同步、组服务等功能。本书不会深入关于ZooKeeper的细节，但只会对操作Kafka所需要的内容进行解释。虽然可以使用Kafka发行版中包含的脚本来运行ZooKeeper服务器，但安装完整版本的ZooKeeper是很简单的。

图2-1 Kafka和Zookeeper

Kafka已经在ZooKeeper 3.5版本上进行了广泛的测试，并定期更新到最新版本。在本书中，我们将使用ZooKeeper 3.5.9，可以从ZooKeeper网站下载。

独立服务器 (Standalone server)

ZooKeeper附带了一个基本的配置示例文件( /usr/local/zookeeper/config/zoo_sample.cfg)，它在大多数情况下都能很好地工作。然而，在本书中，为了演示的目的，将手动创建一个配置文件，其中会使用一些基本设置。下面的示例将ZooKeeper安装在/usr/local/zookeeper中，基本配置在/usr/local/zookeeper中，数据存储在/var/lib/zookeeper中:

# tar -zxf apache-zookeeper-3.5.9-bin.tar.gz

# mv apache-zookeeper-3.5.9-bin /usr/local/zookeeper

# mkdir -p /var/lib/zookeeper

# cp > /usr/local/zookeeper/conf/zoo.cfg << EOF

>tickTime=2000

>dataDir=/var/lib/zookeeper

>clientPort=2181

> EOF

# export JAVA_HOME=/usr/java/jdk-11.0.10

# /usr/local/zookeeper/bin/zkServer.sh start

JMX enabled by default

Using config: /usr/local/zookeeper/bin/../conf/zoo.cfg

Starting zookeeper ... STARTED

现在可以通过连接到客户端端口并发送四个字母的命令srvr来验证ZooKeeper是否在独立模式下正确运行。这将返回运行服务器的基本ZooKeeper信息:

# telnet localhost 2181

Trying127.0.0.1...

Connected to localhost.

Escape character is'^]'.

srvr

Zookeeper version:3.5.9-83df9301aa5c2a5d284a9940177808c01bc35cef, built on01/06/202119:49 GMT

Latency min/avg/max:0/0/0

Received:1

Sent:0

Connections:1

Outstanding:0

Zxid: 0x0

Mode: standalone

Node count:5

Connection closed by foreign host.

Zookeeper集合集群

ZooKeeper是按照集群架构设计的，以确保高可用性。由于使用了平衡算法，建议集群包含奇数个服务器(例如，3、5，等等)，因为大多数集群成员(quorum)必须工作，以便ZooKeeper响应请求。这意味着在三个节点的集群中，可以在缺少一个节点的情况下运行。对于五节点的集群，可以在缺少两个节点的情况下继续运行。

调整Zookeeper集群大小

考虑在一个五节点的集群中运行ZooKeeper。要对集群进行配置更改(包括交换节点)，需要一次重新加载一个节点。如果集群不能容忍一个以上的节点宕机，那么进行维护工作就会带来额外的风险。也不建议运行超过7个节点，因为一致协议的性质会导致性能开始下降。

此外，如果由于太多的客户端连接而导致5或7个节点无法满足负载，可以考虑添加额外的observer节点来帮助平衡只读流量。

要在一个集群中配置ZooKeeper服务器，它们必须有一个包含所有服务器的公共配置，并且每个服务器都需要在data目录中指定服务器ID号的myid文件。如果集群中服务器的主机名是zoo1.example.com、zoo2.example.com和zoo3.example.com，配置文件可能如下所示:

tickTime=2000

dataDir=/var/lib/zookeeper

clientPort=2181

initLimit=20

syncLimit=5

server.1=zoo1.example.com:2888:3888

server.2=zoo2.example.com:2888:3888

server.3=zoo3.example.com:2888:3888

在这个配置中，initLimit是follower与leader连接的超时时间。syncLimit值是不同步的followers与leader的同步超时时间。这两个值的单位都是tickTime，即init Li⁠mit为20 × 2,000毫秒，即40秒。上述配置还列出了集群中的每个服务器。服务器指定使用如下格式：server.X=hostname:peerPort:leaderPort，参数说明如下:

X：服务器的ID号。必须是一个整数，但它不需要是基于零或顺序的。

hostname：服务器的主机名或IP地址。

peerPort：集群中的服务器相互通信的TCP端口。

leaderPort：leader选举的TCP端口。

客户端只需通过clientPort连接到集群，但是集群成员必须能够通过所有三个端口相互通信。

除了共有的配置文件之外，每个服务器必须在dataDir目录中有一个名为myid的文件。此文件必须包含服务器的ID号，该ID号必须与配置文件匹配。完成这些步骤后，服务器将启动并在一个集群中彼此通信。

在一台机器上测试zookeeper集群

通过将配置中的所有主机名指定为localhost，并为每个实例指定唯一的peerPort和leaderPort端口，可以在一台机器上测试和运行ZooKeeper集群。此外，需要为每个实例创建单独的zoo.cfg，并为每个实例定义唯一的dataDir和clientPort。这只用于测试目的，不推荐用于生产系统。

2.2 安装Kafka Broker

配置好Java和ZooKeeper后，就可以开始安装Apache Kafka了。当前版本可以从Kafka网站下载。截至撰写本文时，该版本是2.8.0，运行在Scala版本2.13.0下。本章中的示例使用的是2.7.0版本。

下面的例子中的Kafka安装在/usr/local/ Kafka，使用之前启动的ZooKeeper服务器，并将消息日志段存储在/tmp/Kafka-logs:

# tar -zxf kafka_2.13-2.7.0.tgz

# mv kafka_2.13-2.7.0 /usr/local/kafka

# mkdir /tmp/kafka-logs

# export JAVA_HOME=/usr/java/jdk-11.0.10

# /usr/local/kafka/bin/kafka-server-start.sh -daemon

/usr/local/kafka/config/server.properties

一旦Kafka broker启动，可以通过对集群执行一些简单的操作来验证它是否工作：创建一个test主题(topic)，生产一些消息，并消费这些消息。

创建并验证一个主题:

# /usr/local/kafka/bin/kafka-topics.sh --bootstrap-server localhost:9092 --create --replication-factor 1 --partitions 1 --topic test

Created topic"test".

# /usr/local/kafka/bin/kafka-topics.sh --bootstrap-server localhost:9092 --describe --topic test

Topic:test PartitionCount:1 ReplicationFactor:1 Configs:

Topic: test Partition:0Leader:0Replicas:0Isr:0

生产消息到test主题(使用Ctrl-C停止生产者):

# /usr/local/kafka/bin/kafka-console-producer.sh --bootstrap-server

localhost:9092--topictest

Test Message1

Test Message2

消费来自test主题的消息:

# /usr/local/kafka/bin/kafka-console-consumer.sh --bootstrap-server

localhost:9092--topictest--from-beginning

Test Message1

Test Message2

Processed a total of2messages

已弃用kafka cli工具中的zookeeper连接

如果你熟悉Kafka工具的旧版本，可能习惯使用--zookeeper连接字符串。这在所有情况下都已被弃用。当前的最佳实践是使用更新的--bootstrap-server选项并直接连接到Kafka broker。如果在集群中运行，则可以提供集群中任何broker的 host:port。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,372评论 6赞 498
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,368评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,415评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,157评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,171评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,125评论 1赞 297
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,028评论 3赞 417
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,887评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,310评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,533评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,690评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,411评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,004评论 3赞 325
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,659评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,812评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,693评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,577评论 2赞 353

Kafka权威指南第2版学习笔记--Kafka生产者:写消息到Kafka

推荐阅读更多精彩内容