简介
说明
本文介绍Java进程突然不见了的原因及排查步骤。
Java进程突然消失一般是通过以下几个途径发现的:
- 页面无法打开,返回404
- 应用监控系统报警
Java进程消失原因
- Java应用程序的问题:发生OOM导致进程Crash
- 被操作系统OOM-Killer
- JVM出错:JVM或JDK自身的Bug导致进程Crash
原因及排查方案
应用程序OOM
简介
最常见的是发生堆内存异常“java.lang.OutOfMemoryError: Java heap space”
排查方案
查看堆内存异常时生成的dump文件。
dump文件
- 默认路径:当前路径下,文件名为java_pid[pid].hprof。
- 自定义的路径其可以使用-XX:HeapDumpPath选项来指定路径
然后使用MAT/jprofiler/VisualVM/jhat等工具进行分析即可。
被操作系统OOM-Killer
简介
Linux 内核有个机制叫OOM killer(Out-Of-Memory killer),该机制会在如下情况下杀掉进程:
- 占内存过大,尤其是很快消耗大量内存的进程
- 内存不够用
排查方案
方案1:使用dmesg命令
dmesg -T | grep "Out of memory"
注意:-T 是显示时间戳
结果示例:(如果出现下边这样,有“Out of memory: xxx”,说明发生了OOM-Killer)
方案2:查看日志文件:/var/log/message
直接:grep “Out of memory” /var/log/messages
结果示例:(如果出现下边这样,有“Out of memory: xxx”,说明发生了OOM-Killer)
JVM出错
简介
当JVM发生致命错误导致崩溃时,会生成一个hs_err_pid_xxx.log这样的文件,该文件包含了导致 JVM crash 的重要信息,我们可以通过分析该文件定位到导致 JVM Crash 的原因,从而修复保证系统稳定。
排查方案
默认情况下,该文件是生成在工作目录下的,当然也可以通过 JVM 参数指定生成路径:
-XX:ErrorFile=/var/log/hs_err_pid<pid>.log
这个文件的内容他主要有如下内容
- 日志头文件
- 导致 crash 的线程信息
- 所有线程信息
- 安全点和锁信息
- 堆信息
- 本地代码缓存
- 编译事件
- gc 相关记录
- jvm 内存映射
- jvm 启动参数
- 服务器信息
拿到这个文件后,不用说了,慢慢啃吧。这个文件巨复杂,如果要会读这个文件,请下点功夫。
请先
!