kafak生产运维相关

不同的发行版本

  • Apache kafak
  • Confluent kafka
  • CDH kafak

迭代版本

  • 0.7版本 : 只提供了最基础的消息队列功能
  • 0.8版本 : 引入了副本机制
  • 0.9.0.0版本 : 增加安全认证/权限功能;使用java重写了新版本的消费者api;引入了kafak Connect组件;
  • 0.10.0.0版本 : 引入kafka Streams, 升级成分布式流处理平台
  • 0.11.0.0版本 : 提供了幂等性Producer API及事务API;对kafka>消息格式做了重构
  • 1.0和2.0版本 : Kafka Streams的优化改进
    使用时尽量保持服务器端版本和客户端版本一致

如何估算生产环境所需Kafka 服务器数量

假设公司的机房环境是千兆网络,即 1Gbps; 业务需求1 小时内处理 1TB 的业务数据;需要多少台 Kafka 服务器来完成这个业务呢?

带宽是 1Gbps,即每秒处理 1Gb, 假设 Kafka 会用到 70% 的带宽资源, 再额外预留出 2/3 的资源,即单台服务器使用带宽 700Mb / 3 ≈ 240Mbps;
1 小时内处理 1TB 数据, 根据这个目标,我们每秒需要处理 2336Mb (1024 * 1024 * 8 / 3600 )的数据,除以 240,约等于 10 台服务器; 如果消息还需要额外复制两份,那么总的服务器台数还要乘以 3,即 30 台。

如何估算生产环境所需Kafka 的磁盘容量

假如每天1 亿条消息,每条消息大小1KB, 每条消息保存两份且留存两周的时间;那么kafka集群需要预留多少磁盘空间?

每天的消息大小为1 亿 * 1KB * 2 / 1000 / 1000 = 200GB; 还要为索引等文件预留出 10% 的磁盘空间,那么两周所需要的磁盘空间为:200GB * 1.1 * 14 = 大约 3TB 左右;假设压缩比是 0.75,那么最后你需要规划的存储空间就是 0.75 * 3 = 2.25TB。

重要的生产运维参数

  • 建议配置多个路径,且最好挂载到不同磁盘上
    log.dirs:/home/kafka1,/home/kafka2,/home/kafka3

  • 多个 Kafka 集群使用同一套 ZooKeeper 集群时
    zookeeper.connect: zk1:2181,zk2:2181,zk3:2181/kafka1

  • listeners给内网访问; advertised.listeners主要是为外网访问用的;Broker 端和 Client 端应用配置中最好全部填写主机名
    listeners:SSL: //localhost:9092
    advertised.listeners:

  • 是否允许自动创建 Topic
    auto.create.topics.enable:false

  • 是否允许 Unclean Leader 选举
    unclean.leader.election.enable:false

  • 是否允许定期进行 Leader 选举
    auto.leader.rebalance.enable:false

  • 都是控制一条消息数据被保存多长时间
    log.retention.hours=168 表示默认保存 7 天的数据

  • 指定 Broker 为消息保存的总磁盘容量大小
    log.retention.bytes:值默认是 -1

  • 控制 Broker 能够接收的最大消息大小
    message.max.bytes:默认的 1000012 太少了,还不到 1MB

不丢失消息的参考配置

  • 发送消息时使用带回调的接口
    producer.send(msg, callback)

  • 表明所有ISR中副本 Broker 都要接收到消息,该消息才算是“已提交”
    Producer端的参数 设置设置 acks = all

  • 自动重试消息发送
    Producer端的参数设置retries > 0

  • 将消息多保存几份
    Broker 端的参数 replication.factor >= 3

  • 控制的是消息至少要被写入到多少个副本才算是“已提交”
    Broker 端的参数 min.insync.replicas > 1; 默认值为 1

  • 确保 replication.factor > min.insync.replicas。如果两者相等,那么只要有一个副本挂机,整个分区就无法正常工作了

  • 确保消息消费完成再提交
    Consumer 端的参数 enable.auto.commit=false;并采用手动提交位移的方式

减少Rebalance

  • Consumer 端参数,多久没有接受到心跳移除consumer
    建议session.timeout.ms = 6s 默认10s

  • Consumer 端参数,Consumer 实例发送心跳请求的频率,要保证 Consumer 实例在被判定为“dead”之前,能够发送至少 3 轮的心跳请求
    建议heartbeat.interval.ms = 2s

  • Consumer 端参数,Consumer 端应用程序两次调用 poll 方法的最大时间间隔。 超过Consumer 会主动发起“离开组”的请求(一般发生在手动提交)
    建议max.poll.interval.ms 设置得大一点,比下游最大处理时间稍长一点;默认5分钟; 或改小点max.poll.records(默认500)

参考资料
Kafka核心技术与实战

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 225,498评论 6 524
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 96,668评论 3 406
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 172,857评论 0 370
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 61,305评论 1 303
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 70,308评论 6 401
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 53,747评论 1 316
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 42,078评论 3 431
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 41,080评论 0 280
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 47,649评论 1 327
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 39,644评论 3 347
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 41,760评论 1 355
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 37,352评论 5 351
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 43,076评论 3 341
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 33,490评论 0 25
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 34,651评论 1 277
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 50,353评论 3 383
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 46,828评论 2 367