[bug报告]nxlog字符集转化导致内存泄漏

nxlog号称“日志收集神器”。nxlog 2.8社区版存在一个bug,此bug会导致明显的内存泄漏。

nxlog

重现方法

采用支持自动字符集转化的扩展,对日志数据进行转化时:

<Extension charconv>
    Module xm_charcov
    AutodetectCharsets gbk, utf-8, euc-jp, utf-16, utf-32, iso8859-2
</Extension>

<Input filein>
    Module  im_file
    File  "tmp/input"
    Exec  convert_fields("AUTO", "utf-8");
</Input>

...

nxlog对配置了AUTO源字符集的日志数据进行转化时,会按照顺序从AutodetectCharsets罗列的候选字符集从左到右依次尝试进行转化(采用libiconv),直到成功。

如果源文件的字符集无法匹配第一个AutodetectCharsets,那么将导致内存泄漏,使用valgrind测试得到下面输出:

valgrind

可以看到,在这个测试下,泄漏的字节尽然高达150M,如果测试继续下去,可能更高。在压力测试下,泄漏的速度甚至高达30M/s。而泄漏的根源是iconv_open没有对应的iconv_close

问题分析

通过源码分析,可以发现在src/modules/extension/charconv/charconv.c_nx_convert负责iconv_open,并调用iconv,但是转化失败会导致抛出异常(long jump)。于是iconv_close将被跳过:

_nx_convert

修复方法

修复这个问题有两个方面:

  1. 尽量避免使用AUTO源,通过观察AUTO的逻辑,可以发现效率比较低下,最好能够提前知道源文件的字符编码。夏洛克采集程序Mozilla Firefox浏览器中对文档字符集自动探测算法集成到了产品中,从而尽可能避免使用AUTO
  2. _nx_convert方法内部catch住异常,并在保证关闭后rethrow。由于C语言无法模拟finally,如果考虑到代码的优雅性,那么应避免在iconv_close之前throw异常。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,014评论 19 139
  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 31,780评论 18 399
  • Spring Boot 参考指南 介绍 转载自:https://www.gitbook.com/book/qbgb...
    毛宇鹏阅读 46,974评论 6 342
  • 文/灵懂 我正在看原著,但我看了古天乐,李若彤版的《神雕侠侣》,因此以下的文字全部基于95版的《神雕侠侣》。毕竟电...
    颂亦阅读 1,002评论 0 4
  • 清明节前一天的晚上,基本上都是我自己在家睡,我的家乡的习俗嫁出去的女儿不能回娘家,说是会给谁带来不利,其实一代代传...
    儿子丹尼阅读 183评论 0 0