kafka-可靠性和一致性

数据可靠性

Producer往Broker发送消息

为了让用户设置数据可靠性,kafka在Producer里面体用了消息确认机制。也就是说我们可以通过配置来决定有几个副本收到这条消息才算Producer发送成功。可以在定义Producer时通过acks参数来指定。这个参数支持以下三种值:

  • acks=0:生产者不会等待任何来自服务器的响应。如果当中出现问题,导致服务器没有收到消息,那么生产者无从得知,会造成消息丢失。由于生产者不需要等待服务器的响应所以可以以网络能够支持的最大速度发生消息,从而达到很高的吞吐量。

  • acks=1(默认值):只要集群的Leader节点收到消息,生产者就会收到一个来自服务器的成功响应。如果消息无法到达Leader节点(例如Leader节点崩溃,新的Leader节点还没有被选举出来)生产者就会收到一个错误的响应,为了避免数据丢失,生产者会重发消息。如果一个没有收到消息的节点成为新Leader,消息还是会丢失。此时的吞吐量主要取决于使用的是同步发送还是异步发送,吞吐量还收到发送消息数量的限制,例如生产者在收到服务器响应之前可以发送多少个消息。

  • acks=-1:只有当所有参与复制的节点全部都收到消息时,生产者才会收到一个来自服务器的响应。这种模式是最安全的,可以保证不止一个服务器收到消息,就算有服务器发生崩溃,整个集群依然可以运行。延时比acks=1更高,因为要等待不止一个服务器节点收到消息。

另外,Producer发送消息还可以选择同步(默认,通过producer.type=sync配置)或者异步(producer.type=async)模式。如果设置成异步,虽然会极大的提高消息发送的性能,但是这样会增加丢失数据的风险。如果要确保消息的可靠性,必须将producer.type设置为sync。

Topic分区副本

可以通过default.replication.factor进行配置默认副本格式,默认为3.

Kafka可以保证单个分区里的事件时有序的,分区可以在线(可用),也可以离线(不可用)。在众多的分区副本里有一个副本是Leader,其余的副本是Follower,所有的读写操作都是经过Leader进行的,同时Follower会定期地去leader上复制数据。当Leader挂掉之后,其中一个Follower会重新成为新的Leader。通过分区副本,引入了数据冗余,同时也提供了Kafka的数据可靠性。

Kafka的分区多副本架构是Kafka可靠性保证的核心,把消息写入多个副本可以使Kafka在发生崩溃时扔能保证消息的持久性。

leader选举

在介绍Leader选举之前,让我们先来了解一下ISR(in-sync replicas)列表。每个分区的leader会维护一个ISR列表,ISR列表里面就是follower副本的Broker编号,只有“跟得上"leader的follower副本才能加如到ISR里面,这个是通过replica.lag.time.max.ms参数配置的。只有ISR里的成员才有被选为leader的可能。

所以当Leader挂掉了,而且unclean.leader.election.enable=false的情况下,Kafka会从ISR列表中选择第一个follower作为新的leader,因为这个分区拥有最新的已经committed的消息,通过这个可以保证已经committed的消息的数据可靠性。

综上所述:为了保证数据的可靠性,我们最少需要配置一下几个参数:

  • producer级别:acks=all(或者request.required.acks=-1),同时发送模式为同步producer.type=sync

  • topic级别:设置replication.factor>=3,并且min.insync.replicas>=2

  • broker级别:关闭不完全的leader选举,即unclean.leader.election.enable=false;

数据一致性

这里介绍的数据一致性主要是说无论是老的Leader还是新选举的Leader,Consumer都能读到一样的户数。那么Kafka是如何实现的呢?

假设有三个分区

副本0(Leader) : Message0,Message1 | Message 2 , Message 3

副本1(Follower) :Message0,Message1 | Message 2

副本2 (Follower):Message0,Message1 |

上面的"|" 表示的是High Water Mark

虽然副本0已经写入了Message3,但是Consumer只能读取到Message1.因为所有的ISR都同步了Mesage1,只有High Water Mark以上是消息才支持Consumer读取,而High Water Mark取决于ISR列表里面偏移量最小的分区,对应于副本2,这个很类似于木桶原理。

这样做的原因是还没有被足够多副本复制的消息被认为是“不安全“的,如果Leader发生崩溃,另一个副本称为新Leader,俺么这小消息很可能丢失了。如果我们允许消费者读取这些消息,可能就会破坏一致性。是想,如果一个消费者从当前Leader(副本0)读取并处理了Message3,这个时候Leader挂掉了,选举了副本1位新的Leader,这时候另一个消费者再去从新的Leader读取消息,发现这个消息其实并不存在,这就导致了数据不一致问题。

当然,引入了HighWaterMark机制,会导致Broker间的消息复制因为某些原因变慢,那么消息到达消费者的时间也会随之变长(因为我们会先等待消息复制完毕)。延迟时间可以通过参数replica.lag.time.max.ms参数配置,它指定了副本在复制消息时可被允许的最大延迟时间。

参考: https://www.cnblogs.com/yoke/p/11477167.html

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,723评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,003评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,512评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,825评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,874评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,841评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,812评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,582评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,033评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,309评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,450评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,158评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,789评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,409评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,609评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,440评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,357评论 2 352

推荐阅读更多精彩内容