天天看点

core dump磁盘报警问题排查过程

磁盘报警。分区磁盘容量已经占用超过80%。同一批上线的几台机器都没报警。而且离报警阀值还差很远。

大概的排查步骤如下:

首先,查找导致磁盘报警的大文件

看来是core dump文件过多导致的。

找出产生core dump文件的元凶

很显然,最后一行core was generated by `php-fpm: pool www 已经告诉我们,是php-fpm 产生的。

通过以下命令查看,php-fpm的确有core dump的权限。

注意,最后的的 max core file size 为 unlimited。一般情况下,这个值为unlimited,就可以生成core dump文件。

如果关闭core dump ?

一般设置core file size 是使用 ulimited -c unlimited 命令。在登陆时默认执行的一些文件中,没有找到这个命令的影子。

最终在/etc/security/limits.conf 文件中看到了如下设置:

果断注释掉,然后重启php-fpm 进程。再次查看进程的limit信息。

看来文件修改已经生效。

删除core文件,释放空间

删除后,磁盘空间占用马上降到了50%左右。

注意:

发现虽然/etc/security/limits.conf文件中设置了 core unlimited。但是通过unlimit -a 查看。core 的也是 0。