解密Kafka对时间轮的应用

Kafka 中存在大量的延时操作,如:延时生产、延时拉取、延时删除等。Kafka 没有直接使用 JDK 里面实现的 Timer 或 DelayQueue 来实现延时功能。众所周知,Timer 和 DelayQueue 的任务添加/删除是采用了优先队列(小顶堆)算法实现的,这个算法的平均时间复杂度是 O(nlogn)。这个性能并不能满足 Kakfa 要求。因此,Kafka 使用时间轮实现了自己的延时定时器(SystemTimer),添加/删除操作的平均时间复杂度均为 O(1)。

1 单层时间轮

时间轮结构.png

上图就是一个很经典的时间轮的设计,里面包含了实现时间轮最重要的部分:

  • 表盘

    • 基本时间跨度(tickMs)

      每个时间格有自己的时间跨度

    • 时间轮大小(wheelSize)

    • 总体时间跨度(interval)

      interval = tickMs × wheelSize

    • 表盘指针(currentTime)

      时间轮使用指针区分到期时间格(包含指针指向的部分)和未到期时间格。currentTime 是 tickMs 的整数倍。被指针指到的时间格的 TimerTaskList 全部任务都需要被处理。

    • 时间格

      如上图编码是9的时间格,那么这个时间格的对应的时间区间是 [startMs + 9, startMs + 10)。startMs 是指创建时间轮的createTime。

  • 双向循环链表

    我们真正需要处理的延时任务封装成一个个 TimerTaskEntry 构成一个双向循环链表。

好处:

  1. 这种设计将计时与处理任务分开,任务的处理不影响计时任务
  2. 任务列表 TimerTaskList 与时间格关联后,突然有属于这个时间格的任务可以直接加入链表,时间复杂度是O(1)

用上图的时间轮为例子,假设当前表盘指针指向 0,此时有一个延时2ms的 A 任务插入,那么 A 将会被添加到 2 的 TimerTaskList,随时间推移,指针来到了2,就会开启线程异步处理 2 的 TimerTaskList;假设这时又有一个 8ms 和 19ms 的任务插入,那么8ms的会被添加到 10 的 TimerTaskList,而19ms的会复用已经过期的 1 的 TimerTaskList。

2 多层时间轮

如果此时有一个 350ms 的任务需要插入呢?直接扩充 wheelSize?要知道 Kafka 中延时任务既有几万毫秒的定时任务,也有几十万毫秒的定时任务,盲目扩充 wheelSize 会造成空间浪费,而且过大的时间轮也会影响效率。因此,Kafka 引入了层级时间轮的设计,如下图


多层时间轮.png

350ms的任务已经超过了第一层时间轮的 interval,而第二层的 interval 是 400ms,所以这个任务应该放在第二层时间轮。又因为 350 ÷ 20 = 17.5,所以该任务应该在第二层时间轮的 17 时间格的 TimerTaskList 中。当第二层时间轮的指针指向 17 时,才 340ms,还有 10ms。这时,我们会将任务降级到第一层的时间轮,假设当前第一层时间轮的指针指向2,那么该任务会添加到第一层时间轮的 12 时间格的 TimerTaskList。

注意:
1. 多层时间轮中,第一层的startMs仍然是系统创建时间,而其他层级的时间轮的startMs则是上一层的currentTime
2. 当前层级的currentTime一定是自己的tickMs的整数倍,如果不满足的话,则要进行修改 currentTime = 当前时间 - (当前时间 % tickMs)
3. 通过 overflowWheel 指向下一层级的时间轮

3 时间轮时间推移的实现

到这里,我们知道了时间轮是如何做到添加/删除任务的平均时间复杂度为O(1)的,但是它的计时(或者说时钟/时间推移)是怎么实现的呢?
Kafka 是直接使用了 JDK 的 DelayQueue 实现计时。因为 DalayQueue 计时是可以的,但是完全依赖它来实现延时任务,在添加/操作这块性能就不能达标,所以 Kafka 使用了 DalayQueue 计时,使用了 TimerTaskList 来完成任务的添加/删除。

4 延时操作

时间轮的具体应用

Kafka 中有许多的延时操作,比如当我们 ack 设置成 -1 时,Kafka 会等所有 ISR 都回复 ack 或者超时才会给客户端回复结果。那么 leader 是怎么知道消息是否在允许时间内完成消息同步的呢?又怎么知道同步是否超时的呢?请看下图

同步消息流程图.png

当我们有消息写入 leader 时,Kafka 就会创建一个延时操作,这个延时操作实现了“指定时间内,follower 没完成消息同步,告诉客户端超时”。

值得一提的是 延时操作定时任务,因为延时操作不一定需要到时间才能完成,可以提前完成。当消息同步没有超时完成时,正常返回就是提前完成的情况,如下图

ISR同步消息步骤图_1.png

ISR同步消息步骤图_2.png

ISR同步消息步骤图_3.png

这里就是外部事件触发完成延时操作的。当有消息写入 leader 之后,由于 ack=-1。因此,ISR 的 follower 会立马进行消息同步,每个 follower 同步好之后会告诉 leader。当所有 ISR 中的 follower 均回复 ack 时,leader 就会将 HW 改成 4 之后,并回复客户端结果。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,366评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,521评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,689评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,925评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,942评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,727评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,447评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,349评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,820评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,990评论 3 337
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,127评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,812评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,471评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,017评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,142评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,388评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,066评论 2 355

推荐阅读更多精彩内容