tomcat+java的web程序持续占cpu问题调试

[线上应用故障排查之:高CPU占用]

一个应用占用CPU很高,除了确实是计算密集型应用之外,通常原因都是出现了死循环。
以我们最近出现的一个实际故障为例,介绍怎么定位和解决这类问题。


现象:
在tomcat中部署java的web应用程序,过一段时间后出现tomcat的java进程持续占用cpu高达100%,导致web程序访问受阻。
可能原因分析:
可能程序确实在进行数据计算;或程序进入死循环。
解决方法:

  1. 根据top命令,查看占用cpu的进程PID,发现PID为2738的Java进程占用CPU高达99.9%,出现故障。
  2. 通过ps aux | grep PIDps -ef |grep PID命令,定位具体的进程主体,如是否是tomcat启动的java进程出现了问题。但是,怎么定位到具体线程或者代码呢?

    首先显示线程列表:
  3. ps -mp PID -o THREAD,tid,time命令打印出该进程下的线程占用cpu情况


    找到了耗时最高的线程2804,占用CPU时间快三个半小时了!
  4. 其次用printf "%x\n" TID命令将需要的线程ID转换为16进制格式:
  5. 最后用jstack pid |grep tid -A 30命令打印线程的堆栈信息:

找到出现问题的代码了!

现在来分析下具体的代码即可:

找到出现问题的代码,并分析具体函数中是否有可能出现死循环的代码段。
通常问题出现在while, for之类的循环代码片段。

AlarmSendListener.run(AlarmSendListener.java:98)
SnmpTrapThreads.run(SnmpTrapThreads.java:66)

ProduceAlarmEvent.run(ProduceAlarmEvent.java:50)


最后,总结下排查CPU故障的方法和技巧有哪些:
1、top命令:Linux命令。可以查看实时的CPU使用情况。也可以查看最近一段时间的CPU使用情况。
2、PS命令:Linux命令。强大的进程状态监控命令。可以查看进程以及进程中线程的当前CPU使用情况。属于当前状态的采样数据。
3、jstack:Java提供的命令。可以查看某个进程的当前线程栈运行情况。根据这个命令的输出可以定位某个进程的所有线程的当前运行状态、运行代码,以及是否死锁等等。
4、pstack:Linux命令。可以查看某个进程的当前线程栈运行情况。


特别感谢@hankchen

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 31,779评论 18 399
  • 又来到了一个老生常谈的问题,应用层软件开发的程序员要不要了解和深入学习操作系统呢? 今天就这个问题开始,来谈谈操...
    tangsl阅读 4,176评论 0 23
  • 心若改变,你的态度跟着改变;态度改变,你的习惯跟着改变;习惯改变,你的性格跟着改变;性格改变,你的人生跟着改变。 ...
    剽悍的今天阅读 130评论 2 3
  • ——如果他真的有生,这个时候也该穿着西服,梳着油发,带着简历,穿梭在都市的车水马龙中到处碰壁了 小时候床头经常放着...
    Mr小Z阅读 936评论 0 4
  • 8月的中午应该是明媚,燥热。可是伴随屏幕的渐渐明亮,我才发现,下午一点多如同傍晚的8.9点,这让手机的亮光更为明亮...
    陌雨沐阅读 319评论 0 0