兩種情況會出發 "Out of socket memory" 的資訊:
1.有很多的孤兒套接字(orphan sockets)
2.tcp socket 用盡了給他配置設定的記憶體
首先看看情況 2。對于 TCP socket 來說,使用 pages 來計數的,而非 bytes,一般情況下 1 page = 4096 bytes。page 大小可以通過下面指令獲得:
$ getconf PAGESIZE
4096
檢視核心配置設定了多少的記憶體給 TCP:
$ cat /proc/sys/net/ipv4/tcp_mem
69618 92825 139236
第一個數字表示,當 tcp 使用的 page 少于 69618 時,kernel 不對其進行任何的幹預
第二個數字表示,當 tcp 使用了超過 92825 的 pages 時,kernel 會進入 “memory pressure”
第三個數字表示,當 tcp 使用的 pages 超過 139236 時,我們就會看到題目中顯示的資訊
檢視 tcp 實際用的記憶體:
$ cat /proc/net/sockstat
sockets: used 116
TCP: inuse 3 orphan 0 tw 4 alloc 4 mem 110
UDP: inuse 1 mem 1
UDPLITE: inuse 0
RAW: inuse 0
FRAG: inuse 0 memory 0
可以看到,實際使用的 mem(110) 遠遠小于 69618,是以,“Out of socket memory”的錯誤是由于第一種情況引起的。
orphan socket 對于應用程式來說,意義不大,這也是核心要限制被 orphan socket 消耗記憶體的原因。而對于 web server 來說,有大量的 orphan socket 也屬正常,那麼多的連接配接放在那兒了。
檢視 orphan socket 限制:
$ cat /proc/sys/net/ipv4/tcp_max_orphans
對比目前系統中的:
sockets: used 14565
TCP: inuse 35938 orphan 21564 tw 70529 alloc 35942 mem 1894
由于核心代碼中有個位運算,是以實際的跟最大的是 2x 或者是 4x 的關系。現在根據實際情況,将 tcp_max_orphans 調到一個合理的值就可以了。原則上該值建議隻增大,另外,每個 orphan 會消耗大概 64KB 的記憶體。
還有個叫 tcp_orphan_retries 參數,對于 web server,可以減小。
修改了上面的一些配置參數,報錯日志還是在一直往外報。
####################################################################################################
net.ipv4.tcp_max_orphans = 18000
最後修改值到18000,Out of socket memory報錯解決。
net.ipv4.tcp_max_tw_buckets = 10000
最後修改值到net.ipv4.tcp_max_tw_buckets = 10000,kernel: printk: xxx messages suppressed.報錯解決。
記得參數修改完成執行 sysctl -p
#######################################################################################################
原文
http://www.360doc.com/content/13/0514/01/5407405_285259602.shtml