磁盘报警。分区磁盘容量已经占用超过80%。同一批上线的几台机器都没报警。而且离报警阀值还差很远。
大概的排查步骤如下:
首先,查找导致磁盘报警的大文件
看来是core dump文件过多导致的。
找出产生core dump文件的元凶
很显然,最后一行core was generated by `php-fpm: pool www 已经告诉我们,是php-fpm 产生的。
通过以下命令查看,php-fpm的确有core dump的权限。
注意,最后的的 max core file size 为 unlimited。一般情况下,这个值为unlimited,就可以生成core dump文件。
如果关闭core dump ?
一般设置core file size 是使用 ulimited -c unlimited 命令。在登陆时默认执行的一些文件中,没有找到这个命令的影子。
最终在/etc/security/limits.conf 文件中看到了如下设置:
果断注释掉,然后重启php-fpm 进程。再次查看进程的limit信息。
看来文件修改已经生效。
删除core文件,释放空间
删除后,磁盘空间占用马上降到了50%左右。
注意:
发现虽然/etc/security/limits.conf文件中设置了 core unlimited。但是通过unlimit -a 查看。core 的也是 0。