背景
在用户对POD内存增长比较敏感的时候,记录下来用户登录POD后执行的所有操作,对POD内存增长原因分析会有一定帮助
那么如何记录用户在POD里的操作呢?
实施
直接打log日志
由于提供了web页面给用户登录POD,web是通过WebSocket方式登录POD的,因此可以直接在WebSocket的onMessage方法中收到啥就打印啥
@OnMessage
public void onMessage(String msg, Session session) {
log.info(msg, session);
}
这种方式是最直接、最容易想到的,但是缺点也很明显,收到一个字符打印一个字符,显得有点臃肿
其次是针对一次特殊功能键,如Tab
等提示不好处理,完整的操作命令只能一点点拼凑起来,而且只能拼凑出个大概,可能会长这样
参考HISTORY
这种实现方式主要基于history命令来完成,具体是在POD登录的时候设置如下的一次性环境变量
export HISTFILESIZE=1
export HISTSIZE=1
export HISTORY_FILE=/data/bash/bash.log
export PROMPT_COMMAND=$'{ H=`history 1 |awk \'{$1=""; print $0}\'`;W=`whoami`;CONTAINER=$POD_NAME;IP=$POD_IP;echo -e $(date "+%Y-%m-%d %H:%M:%S") notice bash[]: user: $W container: $CONTAINER podip: $IP execs: "\'"$H"\'";} >> $HISTORY_FILE'
设置方式也很简单,通过k8s客户端API登录POD时,是可以指定commands数组的,我们可以如下指定
return new String[]{"/bin/bash", "-c", HISTORY_BASH_FORMAT + fileName + ";"+HISTORY_BASH_CMD+";"+"/bin/bash"}
设置环境变量后,最后执行一个bash命令,来控制伪终端即可
这种实现方式会将操作时间、容器名称、等信息记录到/data/bash/bash.log文件中,POD只需要挂在这个/data目录即可完成持久化了,这样用户的操作记录都能记录在宿主机上的文件里了
这种方式看着还行,比较直观的记录了用户的操作记录
但是会有一个很明显的问题,就是设置了HISTSIZE和HISTFILESIZE之后,会限制history的历史记录大小,shell里面的上下快捷键就被限制了,使用起来还是不太方便
而且经过测试,针对一些内存limit比较小的POD来说,这种记录方式会引起POD内存的较快增长,同时可能引起CPU的抑制
通过反复对比设置了上述环境变量与否的内存增长图,发现设置了上述环境变量的POD在登录后内存增长更快,而且更容易引起CPU的抑制
原生HISTORY
如果不记录新的文件,直接使用原生history命令支持的立即刷文件和自定义文件呢?
这时候只需要换几个环境变量即可
export HISTTIMEFORMAT='%F %T '
export HISTFILE=/data/bash/bash.log
export PROMPT_COMMAND='history -a'
这样设置就完全使用的是history的一些环境变量了,再观察看看登录POD后的内存增长
此时的内存增长明显变缓,多次实验结果均如此
看来这个才是正确打开方式
其它问题
为什么登录POD后会引起POD内存增长呢?
起初怀疑是通过WebSocket方式登录的问题,后来直接通过kubectl登录POD也会引起一样的内存增长,因为登录后什么操作都没做,甚至没有查看文件,也会引起内存增长
可能和设置的内存limit较小有关,并且这部分内存是没法回收的,登录多次后POM会直接OOM重启,背后原因尚未明确