解密Kafka对时间轮的应用

Kafka 中存在大量的延时操作，如：延时生产、延时拉取、延时删除等。Kafka 没有直接使用 JDK 里面实现的 Timer 或 DelayQueue 来实现延时功能。众所周知，Timer 和 DelayQueue 的任务添加/删除是采用了优先队列（小顶堆）算法实现的，这个算法的平均时间复杂度是 O(nlogn)。这个性能并不能满足 Kakfa 要求。因此，Kafka 使用时间轮实现了自己的延时定时器（SystemTimer），添加/删除操作的平均时间复杂度均为 O(1)。

1 单层时间轮

时间轮结构.png

上图就是一个很经典的时间轮的设计，里面包含了实现时间轮最重要的部分：

表盘
- 基本时间跨度（tickMs）
  
  每个时间格有自己的时间跨度
- 时间轮大小（wheelSize）
- 总体时间跨度（interval）
  
  interval = tickMs × wheelSize
- 表盘指针（currentTime）
  
  时间轮使用指针区分到期时间格（包含指针指向的部分）和未到期时间格。currentTime 是 tickMs 的整数倍。被指针指到的时间格的 TimerTaskList 全部任务都需要被处理。
- 时间格
  
  如上图编码是9的时间格，那么这个时间格的对应的时间区间是 [startMs + 9, startMs + 10)。startMs 是指创建时间轮的createTime。
双向循环链表

我们真正需要处理的延时任务封装成一个个 TimerTaskEntry 构成一个双向循环链表。

好处：

这种设计将计时与处理任务分开，任务的处理不影响计时任务
任务列表 TimerTaskList 与时间格关联后，突然有属于这个时间格的任务可以直接加入链表，时间复杂度是O(1)

用上图的时间轮为例子，假设当前表盘指针指向 0，此时有一个延时2ms的 A 任务插入，那么 A 将会被添加到 2 的 TimerTaskList，随时间推移，指针来到了2，就会开启线程异步处理 2 的 TimerTaskList；假设这时又有一个 8ms 和 19ms 的任务插入，那么8ms的会被添加到 10 的 TimerTaskList，而19ms的会复用已经过期的 1 的 TimerTaskList。

2 多层时间轮

如果此时有一个 350ms 的任务需要插入呢？直接扩充 wheelSize？要知道 Kafka 中延时任务既有几万毫秒的定时任务，也有几十万毫秒的定时任务，盲目扩充 wheelSize 会造成空间浪费，而且过大的时间轮也会影响效率。因此，Kafka 引入了层级时间轮的设计，如下图

多层时间轮.png

350ms的任务已经超过了第一层时间轮的 interval，而第二层的 interval 是 400ms，所以这个任务应该放在第二层时间轮。又因为 350 ÷ 20 = 17.5，所以该任务应该在第二层时间轮的 17 时间格的 TimerTaskList 中。当第二层时间轮的指针指向 17 时，才 340ms，还有 10ms。这时，我们会将任务降级到第一层的时间轮，假设当前第一层时间轮的指针指向2，那么该任务会添加到第一层时间轮的 12 时间格的 TimerTaskList。

注意：
1. 多层时间轮中，第一层的startMs仍然是系统创建时间，而其他层级的时间轮的startMs则是上一层的currentTime
2. 当前层级的currentTime一定是自己的tickMs的整数倍，如果不满足的话，则要进行修改 currentTime = 当前时间 - (当前时间 % tickMs)
3. 通过 overflowWheel 指向下一层级的时间轮

3 时间轮时间推移的实现

到这里，我们知道了时间轮是如何做到添加/删除任务的平均时间复杂度为O(1)的，但是它的计时（或者说时钟/时间推移）是怎么实现的呢？
Kafka 是直接使用了 JDK 的 DelayQueue 实现计时。因为 DalayQueue 计时是可以的，但是完全依赖它来实现延时任务，在添加/操作这块性能就不能达标，所以 Kafka 使用了 DalayQueue 计时，使用了 TimerTaskList 来完成任务的添加/删除。

4 延时操作

时间轮的具体应用

Kafka 中有许多的延时操作，比如当我们 ack 设置成 -1 时，Kafka 会等所有 ISR 都回复 ack 或者超时才会给客户端回复结果。那么 leader 是怎么知道消息是否在允许时间内完成消息同步的呢？又怎么知道同步是否超时的呢？请看下图

同步消息流程图.png

当我们有消息写入 leader 时，Kafka 就会创建一个延时操作，这个延时操作实现了“指定时间内，follower 没完成消息同步，告诉客户端超时”。

值得一提的是 延时操作 ≠ 定时任务，因为延时操作不一定需要到时间才能完成，可以提前完成。当消息同步没有超时完成时，正常返回就是提前完成的情况，如下图

ISR同步消息步骤图_1.png

ISR同步消息步骤图_2.png

ISR同步消息步骤图_3.png

这里就是外部事件触发完成延时操作的。当有消息写入 leader 之后，由于 ack=-1。因此，ISR 的 follower 会立马进行消息同步，每个 follower 同步好之后会告诉 leader。当所有 ISR 中的 follower 均回复 ack 时，leader 就会将 HW 改成 4 之后，并回复客户端结果。

最后编辑于：2023.10.23 00:29:21

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 219,366评论 6赞 508
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,521评论 3赞 395
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 165,689评论 0赞 356
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,925评论 1赞 295
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,942评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,727评论 1赞 305
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,447评论 3赞 420
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,349评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,820评论 1赞 317
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,990评论 3赞 337
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,127评论 1赞 351
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,812评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,471评论 3赞 331
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,017评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,142评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,388评论 3赞 373
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,066评论 2赞 355

解密Kafka对时间轮的应用

1 单层时间轮

2 多层时间轮

3 时间轮时间推移的实现

4 延时操作

推荐阅读更多精彩内容