Netty 内存管理探险: PoolArena 统计之BUG和解决

在本系列的上一篇《Netty 内存管理探险: PoolArena 分配之谜》中，我们将 xharbor 的启动参数扩充为5个：

-XX:MaxDirectMemorySize=96M
-Dio.netty.allocator.type=pooled
-Dio.netty.allocator.tinyCacheSize=0
-Dio.netty.allocator.smallCacheSize=0
-Dio.netty.allocator.normalCacheSize=0

-XX:MaxDirectMemorySize=96M 参数确保至少存在一个DirectMemory内存池; -Dio.netty.allocator.type=pooled参数指定缺省的内存管理策略为池化(pooled)方式; 后面三个启动参数禁用了 Netty 池化内存的线程局部缓存，方便我们检查是否有内存使用上的泄漏(ByteBuf LEAK)。启动 xharbor，在线上运行一段时间后，通过 xbeacon 观察到内存池 PoolArena 上的分配/释放/活跃指标如下图所示：

xharbor 的Direct PoolArena 内存管理指标着色版 by xbeacon

虽然分配和释放的总数相等，都是 2404，但 tiny / small / normal 分项统计存在令人费解的误差。tiny / small 类型的释放数比分配数要多，而 normal 的释放数始终比分配数要少。

备注：关于 PoolArena 的四种内存分配尺寸，请参见 Netty内存池原理分析，此处不再赘述原理。

这造型很像是有BUG啊？！还是从代码去探索真相吧！

PoolArena 统计指标确有BUG

跟着 PoolArena 的分配内存入口函数 allocate 跟踪下去，唯一增加 tiny / small 分配计数的代码片段如下：

synchronized (head) {
    final PoolSubpage<T> s = head.next;
    if (s != head) {
        assert s.doNotDestroy && s.elemSize == normCapacity;
        long handle = s.allocate();
        assert handle >= 0;
        s.chunk.initBufWithSubpage(buf, handle, reqCapacity);
        if (tiny) {
            allocationsTiny.increment();
        } else {
            allocationsSmall.increment();
        }
       return;
    }
}
allocateNormal(buf, reqCapacity, normCapacity);
return;

但是... 但是...各位观众....问题来了，当上面代码中的双向链表初始化的时候, s == head 是成立的。相关代码片段位于 PoolArena 的构造函数中：

tinySubpagePools = newSubpagePoolArray(numTinySubpagePools);
for (int i = 0; i < tinySubpagePools.length; i ++) {
    tinySubpagePools[i] = newSubpagePoolHead(pageSize);
}
...
smallSubpagePools = newSubpagePoolArray(numSmallSubpagePools);
for (int i = 0; i < smallSubpagePools.length; i ++) {
    smallSubpagePools[i] = newSubpagePoolHead(pageSize);
}

而 newSubpagePoolHead 的功能是初始化 tiny / small 的内存页面，代码如下：

private PoolSubpage<T> newSubpagePoolHead(int pageSize) {
    PoolSubpage<T> head = new PoolSubpage<T>(pageSize);
    head.prev = head;
    head.next = head;
    return head;
}

各位观众，看到了吧！在上面的代码中，初始化完成后的 tiny / small 内存页面 head.next == head。因此，不同尺寸的 tiny / small 的首次分配没有使对应的计数器加1，而是直接调用 allocateNormal 来完成内存分配。

private synchronized void allocateNormal(
    PooledByteBuf<T> buf, 
    int reqCapacity, 
    int normCapacity) {
    if (q050.allocate(buf, reqCapacity, normCapacity) 
       || q025.allocate(buf, reqCapacity, normCapacity) 
       || q000.allocate(buf, reqCapacity, normCapacity) 
       || qInit.allocate(buf, reqCapacity, normCapacity) 
       || q075.allocate(buf, reqCapacity, normCapacity)) {
        ++allocationsNormal;
        return;
    }
    // Add a new chunk.
    PoolChunk<T> c = newChunk(
         pageSize, maxOrder, pageShifts, chunkSize);
    long handle = c.allocate(normCapacity);
    ++allocationsNormal;
    assert handle > 0;
    c.initBuf(buf, handle, reqCapacity);
    qInit.add(c);
}

如上所示，在 allocateNormal 中，无论是从 q050/q025/q000/qInit/q075 中分配到内存，还是在最后，创建一个新的 memory chunk(还记得缺省情况下，一个chunk的尺寸吗？是16M哦)，直接在 chunk 中分配内存，都妥妥的是将 normal 类型的计数器做了加1。因此，真相大白了：在 netty 4.0.43 (4.0.x 分支) 和 4.1.7 (4.1.x 分支) 及以前的版本中，一部分的 tiny / small 分配行为错误地对 normal 类型的计数器增加了计数，才出现了本文开始截图中的统计指标分项误差。

若干细节的确认

接下来，我们通过确认若干细节来加强这一BUG的判断可信度。

通过 allocateNormal 能分配出适当的 tiny / small 内存大小吗？
在 allocateNormal 中，事实上是通过 PoolChunk.allocate 来分配内存的，代码如下：

long allocate(int normCapacity) {
    if ((normCapacity & subpageOverflowMask) != 0) { 
        // >= pageSize
        return allocateRun(normCapacity);
    } else {
        return allocateSubpage(normCapacity);
    }
}

如上所示，最终还是根据normCapacity的大小来分别调用 allocateSubpage(单页面内分配 tiny / small 类型内存)和allocateRun(连续的多页分配 normal 类型内存) 分配内存块的。

Deallocation 的分项计数为什么是正确的？
内存块的释放(Deallocation)计数是在 freeChunk 中进行的，代码如下：

void freeChunk(PoolChunk<T> chunk, long handle, 
    SizeClass sizeClass) {
    final boolean destroyChunk;
    synchronized (this) {
        switch (sizeClass) {
        case Normal:
            ++deallocationsNormal;
            break;
        case Small:
            ++deallocationsSmall;
            break;
        case Tiny:
            ++deallocationsTiny;
            break;
        default:
            throw new Error();
        }
        destroyChunk = !chunk.parent.free(chunk, handle);
    }
    if (destroyChunk) {
        // destroyChunk not need to be called 
        // while holding the synchronized lock.
        destroyChunk(chunk);
    }
}

可以看到，释放计数是根据SizeClass来确定的，因此不存在类似分配计数的问题。

发现BUG后的动作...

发现BUG后，接下来怎么做？在开源世界里，很简单：在源库中提交 issue，更进一步，还可以提交一个 Pull Request 向代码库维护成员提供BUG的解决方案。我也正是这么做的。我向 netty 提交的 issue 编号为 #6282: Incorrect allocations value for PoolArena (tiny / small / normal)。如果读者打开链接，可以看到，我基本上把本文内容在 issue 描述中复述了一遍。一开始，netty 的主要贡献者 normanmaurer 也误以为是没有考虑线程局部缓存的原因，他的回复如下：

**[normanmaurer](https://github.com/normanmaurer)** 的回答

我赶紧又 balabalabala...... 说明已经禁用了 ThreadLocal cache(参见本系列第二篇《Netty 内存管理探险: PoolArena 分配之谜》中对线程局部缓存的说明)，但分项计数还是有误差哦。normanmaurer 仔细一瞅，晕！此处确有问题。接下来几天来回探讨了我提交的 Pull Request 中的风格、性能等问题，不得不说，netty 库的作者们确实在性能上颇为重视。

如下是我的初始提交版本和 normanmaurer 的修正版本：

我的初始提交版本
 https://github.com/netty/netty/pull/6288/commits/e0b79fe7e7e70ccaf5c3178be773c0a8a552a1fe
normanmaurer的修正版本：
https://github.com/netty/netty/commit/f10f8a31318a2e408b979de6a8ed49caa615d86a
感兴趣的读者可打开链接感受下大神们对代码的极致追求。

所以最终的结果是：该 PR 被接受并放到写本系列时才发布的 netty 最新版本 4.0.44.Final/4.1.8.Final 中。

用 4.1.8.Final 验证一下

将 xharbor 依赖的 netty 版本升级到 4.1.8.Final，编译/打包/上线/运行验证结果如下图所示：

xharbor 的Direct PoolArena 内存管理指标 with netty 4.1.8.Final by xbeacon

从图上看，总分配和总释放数量，以及各个分项指标对应的内存分配计数和释放计数数值完全相等。至此，对于 Netty池化内存管理的统计指标，我们总算有了一个精确的工具。

总结

对于使用池化内存管理策略的 Netty 应用，如果要精确查看内存使用是否存在泄漏，请按照如下步骤配置：

确保使用 netty 4.0.44.Final 、4.1.8.Final 或其后续版本；
在 JVM 启动参数中添加如下5个：

-XX:MaxDirectMemorySize=96M
-Dio.netty.allocator.type=pooled
-Dio.netty.allocator.tinyCacheSize=0
-Dio.netty.allocator.smallCacheSize=0
-Dio.netty.allocator.normalCacheSize=0

编程导出应用所使用的 PooledByteBufAllocator.directArenas 各个属性，也可直接使用 jocean-http 库中的统计POJO 类：PooledAllocatorStats

在此，笔者祝大家在使用 netty 的道路上知己知彼，放心的享用这一高性能的异步IO框架大餐。

下一篇，我想聊聊这个系列文章的源起：我们自研的微服务框架核心部件之一—— API 网关服务 xharbor 。

本系列：

参考：

Netty内存池原理分析

最后编辑于：2017.12.05 09:36:05

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 211,290评论 6赞 491
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,107评论 2赞 385
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 156,872评论 0赞 347
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,415评论 1赞 283
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,453评论 6赞 385
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,784评论 1赞 290
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,927评论 3赞 406
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,691评论 0赞 266
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,137评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,472评论 2赞 326
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,622评论 1赞 340
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,289评论 4赞 329
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,887评论 3赞 312
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,741评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,977评论 1赞 265
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,316评论 2赞 360
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,490评论 2赞 348

Netty 内存管理探险: PoolArena 统计之BUG和解决

PoolArena 统计指标确有BUG

若干细节的确认

发现BUG后的动作...

用 4.1.8.Final 验证一下

总结

推荐阅读更多精彩内容