本文介紹如何将一個 Web 應用,啟動為守護程序。
一、問題的由來
Web應用寫好後,下一件事就是啟動,讓它一直在背景運作。
這并不容易。舉例來說,下面是一個最簡單的Node應用
server.js
,隻有6行。
var http = require('http');
http.createServer(function(req, res) {
res.writeHead(200, {'Content-Type': 'text/plain'});
res.end('Hello World');
}).listen(5000);
你在指令行下啟動它。
$ node server.js
看上去一切正常,所有人都能快樂地通路 5000 端口了。但是,一旦你退出指令行視窗,這個應用就一起退出了,無法通路了。
怎麼才能讓它變成系統的守護程序(daemon),成為一種服務(service),一直在那裡運作呢?
二、前台任務與背景任務
上面這樣啟動的腳本,稱為"前台任務"(foreground job)。它會獨占指令行視窗,隻有運作完了或者手動中止,才能執行其他指令。
變成守護程序的第一步,就是把它改成"背景任務"(background job)。
$ node server.js &
隻要在指令的尾部加上符号
&
,啟動的程序就會成為"背景任務"。如果要讓正在運作的"前台任務"變為"背景任務",可以先按
ctrl + z
,然後執行
bg
指令(讓最近一個暫停的"背景任務"繼續執行)。
"背景任務"有兩個特點。
- 繼承目前 session (對話)的标準輸出(stdout)和标準錯誤(stderr)。是以,背景任務的所有輸出依然會同步地在指令行下顯示。
- 不再繼承目前 session 的标準輸入(stdin)。你無法向這個任務輸入指令了。如果它試圖讀取标準輸入,就會暫停執行(halt)。
可以看到,"背景任務"與"前台任務"的本質差別隻有一個:是否繼承标準輸入。是以,執行背景任務的同時,使用者還可以輸入其他指令。
三、SIGHUP信号
變為"背景任務"後,一個程序是否就成為了守護程序呢?或者說,使用者退出 session 以後,"背景任務"是否還會繼續執行?
Linux系統是這樣設計的。
- 使用者準備退出 session
- 系統向該 session 發出
信号
SIGHUP
- session 将
信号發給所有子程序
SIGHUP
- 子程序收到
信号後,自動退出
SIGHUP
上面的流程解釋了,為什麼"前台任務"會随着 session 的退出而退出:因為它收到了
SIGHUP
信号。
那麼,"背景任務"是否也會收到
SIGHUP
信号?
這由 Shell 的
huponexit
參數決定的。
$ shopt | grep huponexit
執行上面的指令,就會看到
huponexit
參數的值。
大多數Linux系統,這個參數預設關閉(
off
)。是以,session 退出的時候,不會把
SIGHUP
信号發給"背景任務"。是以,一般來說,"背景任務"不會随着 session 一起退出。
四、disown 指令
通過"背景任務"啟動"守護程序"并不保險,因為有的系統的
huponexit
參數可能是打開的(
on
)。
更保險的方法是使用
disown
指令。它可以将指定任務從"背景任務"清單(
jobs
指令的傳回結果)之中移除。一個"背景任務"隻要不在這個清單之中,session 就肯定不會向它發出
SIGHUP
$ node server.js &
$ disown
執行上面的指令以後,
server.js
程序就被移出了"背景任務"清單。你可以執行
jobs
指令驗證,輸出結果裡面,不會有這個程序。
disown
的用法如下。
# 移出最近一個正在執行的背景任務
$ disown
# 移出所有正在執行的背景任務
$ disown -r
# 移出所有背景任務
$ disown -a
# 不移出背景任務,但是讓它們不會收到SIGHUP信号
$ disown -h
# 根據jobId,移出指定的背景任務
$ disown %2
$ disown -h %2
五、标準 I/O
使用
disown
指令之後,還有一個問題。那就是,退出 session 以後,如果背景程序與标準I/O有互動,它還是會挂掉。
還是以上面的腳本為例,現在加入一行。
var http = require('http');
http.createServer(function(req, res) {
console.log('server starts...'); // 加入此行
res.writeHead(200, {'Content-Type': 'text/plain'});
res.end('Hello World');
}).listen(5000);
啟動上面的腳本,然後再執行
disown
指令。
$ node server.js &
$ disown
接着,你退出 session,通路5000端口,就會發現連不上。
這是因為"背景任務"的标準 I/O 繼承自目前 session,
disown
指令并沒有改變這一點。一旦"背景任務"讀寫标準 I/O,就會發現它已經不存在了,是以就報錯終止執行。
為了解決這個問題,需要對"背景任務"的标準 I/O 進行重定向。
$ node server.js > stdout.txt 2> stderr.txt < /dev/null &
$ disown
上面這樣執行,基本上就沒有問題了。
六、nohup 指令
還有比
disown
更友善的指令,就是
nohup
。
$ nohup node server.js &
nohup
指令對
server.js
程序做了三件事。
- 阻止
信号發到這個程序。
SIGHUP
- 關閉标準輸入。該程序不再能夠接收任何輸入,即使運作在前台。
- 重定向标準輸出和标準錯誤到檔案
nohup.out
也就是說,
nohup
指令實際上将子程序與它所在的 session 分離了。
注意,
nohup
指令不會自動把程序變為"背景任務",是以必須加上
&
符号。
七、Screen 指令與 Tmux 指令
另一種思路是使用 terminal multiplexer (終端複用器:在同一個終端裡面,管理多個session),典型的就是 Screen 指令和 Tmux 指令。
它們可以在目前 session 裡面,建立另一個 session。這樣的話,目前 session 一旦結束,不影響其他 session。而且,以後重新登入,還可以再連上早先建立的 session。
Screen 的用法如下。
# 建立一個 session
$ screen
$ node server.js
然後,按下
ctrl + A
和
ctrl + D
,回到原來的 session,從那裡登出。下次登入時,再切回去。
$ screen -r
如果建立多個背景 session,就需要為它們指定名字。
$ screen -S name
# 切回指定 session
$ screen -r name
$ screen -r pid_number
# 列出所有 session
$ screen -ls
如果要停掉某個 session,可以先切回它,然後按下
ctrl + c
ctrl + d
Tmux 比 Screen 功能更多、更強大,它的基本用法如下。
$ tmux
$ node server.js
# 傳回原來的session
$ tmux detach
除了
tmux detach
,另一種方法是按下
Ctrl + B
d
,也可以回到原來的 session。
# 下次登入時,傳回背景正在運作服務session
$ tmux attach
如果建立多個 session,就需要為每個 session 指定名字。
# 建立 session
$ tmux new -s session_name
# 切換到指定 session
$ tmux attach -t session_name
# 列出所有 session
$ tmux list-sessions
# 退出目前 session,傳回前一個 session
$ tmux detach
# 殺死指定 session
$ tmux kill-session -t session-name
八、Node 工具
對于 Node 應用來說,可以不用上面的方法,有一些專門用來啟動的工具:forever,nodemon 和 pm2。
forever 的功能很簡單,就是保證程序退出時,應用會自動重新開機。
# 作為前台任務啟動
$ forever server.js
# 作為服務程序啟動
$ forever start app.js
# 停止服務程序
$ forever stop Id
# 重新開機服務程序
$ forever restart Id
# 監視目前目錄的檔案變動,一有變動就重新開機
$ forever -w server.js
# -m 參數指定最多重新開機次數
$ forever -m 5 server.js
# 列出所有程序
$ forever list
nodemon
一般隻在開發時使用,它最大的長處在于 watch 功能,一旦檔案發生變化,就自動重新開機程序。
# 預設監視目前目錄的檔案變化
$ nodemon server.js
# 監視指定檔案的變化
$ nodemon --watch app --watch libs server.js
pm2 的功能最強大,除了重新開機程序以外,還能實時收集日志和監控。
# 啟動應用
$ pm2 start app.js
# 指定同時起多少個程序(由CPU核心數決定),組成一個叢集
$ pm2 start app.js -i max
# 列出所有任務
$ pm2 list
# 停止指定任務
$ pm2 stop 0
# 重新開機指定任務
$ pm2 restart 0
# 删除指定任務
$ pm2 delete 0
# 儲存目前的所有任務,以後可以恢複
$ pm2 save
# 列出每個程序的統計資料
$ pm2 monit
# 檢視所有日志
$ pm2 logs
# 導出資料
$ pm2 dump
# 重新開機所有程序
$ pm2 kill
$ pm2 resurect
# 啟動web界面 http://localhost:9615
$ pm2 web
十、Systemd
除了專用工具以外,Linux系統有自己的守護程序管理工具 Systemd 。它是作業系統的一部分,直接與核心互動,性能出色,功能極其強大。我們完全可以将程式交給 Systemd ,讓系統統一管理,成為真正意義上的系統服務。
(完)