在Linux下面部署應用的時候,有時候會遇上Socket/File: Can’t open so many files的問題,其實Linux是有檔案句柄限制的,而且預設不是很高,一般都是1024,作為一台生産伺服器,其實很容易就達到這個數量,是以我們需要把這個值改大一些。
我們可以用ulimit -a來檢視所有限制值,現在隻關心檔案句柄數量的問題
open files (-n) 1024
這個就是限制數量
這裡,有很多ulimit的文章都說的很含糊,究竟這個1024是系統的限制,還是使用者的限制呢。其實,這個是使用者限制來的,完整的說法,應該是目前使用者準備要運作的程式的限制。
1、這個限制是針對單個程式的限制
2、這個限制不會改變之前已經運作了的程式的限制
3、對這個值的修改,退出了目前的shell就會消失
比如說,我先運作了一個程式A,然後通過ulimit修改了限制為2048,然後運作B,然後退出了shell再登入,然後運作C。那就隻有B可以打開2048個句柄。
如果我們需要改變整體的限制值,或者我們運作的程式是系統啟動的,應該怎麼處理呢
其中一個方法,是想ulimit修改指令放入/etc/profile裡面,但是這個做法并不好
正确的做法,應該是修改/etc/security/limits.conf
裡面有很詳細的注釋,比如
* soft nofile 2048
* hard nofile 32768
就可以将檔案句柄限制統一改成軟2048,硬32768
這裡涉及另外一個問題,什麼是軟限制,什麼是硬限制
硬限制是實際的限制,而軟限制,是warnning限制,隻會做出warning
其實ulimit指令本身就有分軟硬設定,加-H就是硬,加-S就是軟
預設顯示的是軟限制,如果修改的時候沒有加上的話,就是兩個一起改
配置檔案最前面的一位是domain,設定為星号代表全局,另外你也可以針對不同的使用者做出不同的限制
修改了,重新登入用ulimit一開就立刻生效了,不過之前啟動過的程式要重新啟動才能使用新的值。我用的是CentOS,似乎有些系統需要重新開機才能生效。
ulimit其實就是對單一程式的限制
那系統總限制呢
其實是在這裡,/proc/sys/fs/file-max
可以通過cat檢視目前的值,echo來立刻修改
另外還有一個,/proc/sys/fs/file-nr
隻讀,可以看到整個系統目前使用的檔案句柄數量
查找檔案句柄問題的時候,還有一個很實用的程式lsof
可以很友善看到某個程序開了那些句柄
也可以看到某個檔案/目錄被什麼程序占用了(umount不了就可以看誰的問題了)