前提说明
- 如果cpu持续100%,建议采用下面措施
//www.greatytc.com/p/a8fe737b2176
- 如果cpu在某些场景下,快速飙高/升,不易捕捉堆栈和线程信息,可以猜用以下方法
脚本原理
- 脚本的原理说明,脚本通过cron定时任务,定时执行抓取Java应用的堆栈,线程信息。
- 脚本通过定时查询相关应用的cpu使用率,如果cpu超过一定的阈值,则将java应用的堆栈信息导出来
- 注意事项:1.日志路径,应用名称,jvm工具包路径。2.下面脚本采集的cpu最高的java进程(需要根据具体场景修改shell脚本)。
配置过程
- 脚本
#!/bin/bash
# 计算CPU使用率
TIME_INTERVAL=2
time=$(date "+%Y-%m-%d %H:%M:%S")
LAST_CPU_INFO=$(cat /proc/stat | grep -w cpu | awk '{print $2,$3,$4,$5,$6,$7,$8}')
LAST_SYS_IDLE=$(echo $LAST_CPU_INFO | awk '{print $4}')
LAST_TOTAL_CPU_T=$(echo $LAST_CPU_INFO | awk '{print $1+$2+$3+$4+$5+$6+$7}')
sleep ${TIME_INTERVAL}
NEXT_CPU_INFO=$(cat /proc/stat | grep -w cpu | awk '{print $2,$3,$4,$5,$6,$7,$8}')
NEXT_SYS_IDLE=$(echo $NEXT_CPU_INFO | awk '{print $4}')
NEXT_TOTAL_CPU_T=$(echo $NEXT_CPU_INFO | awk '{print $1+$2+$3+$4+$5+$6+$7}')
#系统空闲时间
SYSTEM_IDLE=`echo ${NEXT_SYS_IDLE} ${LAST_SYS_IDLE} | awk '{print $1-$2}'`
#CPU总时间
TOTAL_TIME=`echo ${NEXT_TOTAL_CPU_T} ${LAST_TOTAL_CPU_T} | awk '{print $1-$2}'`
CPU_USAGE=`echo ${SYSTEM_IDLE} ${TOTAL_TIME} | awk '{printf "%d", 100-$1/$2*100}'`
#阈值
THRESHOLD=75
if [ $CPU_USAGE -lt $THRESHOLD ]; then
echo "当前CPU未达到阈值,当前值为" $CPU_USAGE
return
fi
# 入参只有一个,即目标java的pid,如果没有,则默认找cpu最高的java进程
if [ -z "$1" ]; then
### 1.先找到消耗cpu最高的Java进程 ###
pid=`ps -eo pid,%cpu,cmd --sort=-%cpu | grep java | grep -v grep | head -1 | awk 'END{print $1}' `
if [ "$pid" = "" ]; then
echo "无Java进程,退出。"
exit
fi
else
pid=$1
fi
### 2.生成dump后的文件名 ###
curTime=$(date +%Y%m%dT%H:%M:%S)
# jstack后的文件会加上时间,便于对一个进程dump多次
dumpFilePath="/home/admin/pid-$pid-$curTime.jstack"
echo -e "cpu最高的java进程: "`/opt/edas/jdk/java/bin/jps | grep $pid`"\n" > $dumpFilePath
### 3.取到该进程的所有线程及其cpu(只显示cpu大于0.0的线程) ###
echo -e "进程内线程cpu占比如下(不显示cpu占比为0的线程):\n" >> $dumpFilePath
ps H -eo pid,tid,%cpu --sort=-%cpu | grep $pid | awk '$3 > 0.0 {totalCpu+=$3; printf("nid=0x%x, cpu=%s\n", $2, $3) >> "'$dumpFilePath'"}
END{printf("cpu总占比:%s\n\n", totalCpu) >> "'$dumpFilePath'"}'
### 4.dump该进程 ###
echo -e "如下是原生jstack后的结果:\n" >> $dumpFilePath
/opt/edas/jdk/java/bin/jstack -l $pid >> $dumpFilePath
echo "dump成功,请前往查看(文件名包含时间,为了采集更准确,可以多执行几次该命令):" $dumpFilePath
- 定时任务
cd /etc/crontab
# 定时两分钟执行一次
*/2 * * * * admin source /home/admin/cpu.sh
查看定时任务执行日志
cat /var/log/cron