我們經常會碰到用 telnet/ssh 登錄了遠程的 Linux 服務器,運行了一些耗時較長的任務, 結果卻由於網絡的不穩定、系統超時或者用戶 logout 從而導致任務中途失敗。那麼怎麼讓命令提交後不受本地關閉終端窗口/網絡斷開連接的干擾呢?下面收集整理了一些實際的例子, 您可以針對不同的場景選擇不同的方式來解決這個問題。
一、業務場景1:
我們知道,當用戶注銷(logout)或者網絡斷開時,終端會收到 HUP(hangup)信號從而關閉其所有子進程。因此,我們的解決辦法就有兩種途徑:要麼讓進程忽略 HUP 信號,要麼讓進程運行在新的會話裡從而成為不屬於此終端的子進程。
1. nohup
nohup 無疑是我們首先想到的辦法。顧名思義,nohup 的用途就是讓提交的命令忽略 hangup 信號。只需在要處理的命令前加上 nohup 即可,標准輸出和標准錯誤缺省會被重定向到 nohup.out 文件中。一般我們可在結尾加上”&”來將命令同時放入後台運行,也可用”>filename 2>&1″來更改缺省的重定向文件名。
示列1:
[root@test ~]# nohup ping www.chinaunix.net &
[1] 3059
nohup: appending output to `nohup.out’
[root@test ~]# ps -ef |grep ping
root 3059 984 0 21:06 pts/3 00:00:00 ping www.chinaunix.net
root 3067 984 0 21:06 pts/3 00:00:00 grep 3059
二、業務場景2:
1.setsid
nohup 無疑能通過忽略 HUP 信號來使我們的進程避免中途被中斷,但如果我們換個角度思考,如果我們的進程不屬於接受 HUP 信號的終端的子進程,那麼自然也就不會受到 HUP 信號的影響了。為了解決這個問題那麼我們就需要另外一個命令:setsid 。
示例2:
[root@test ~]# setsid ping www.chinaunix.net
[root@test ~]# ps -ef |grep www.chinaunix.net
root 31094 1 0 07:28 ? 00:00:00 ping www.chinaunix.net
root 31102 29217 0 07:29 pts/4 00:00:00 grep www.chinaunix.net
[root@test ~]#
值得注意的是,上例中我們的進程 ID(PID)為31094,而它的父 ID(PPID)為1(即為 init 進程 ID),並不是當前終端的進程 ID。
2.&
這裡還有一個關於 subshell 的小技巧。我們知道,將一個或多個命名包含在“()”中就能讓這些命令在子 shell 中運行中,從而擴展出很多有趣的功能,我們現在要討論的就是其中之一。
當我們將”&”也放入“()”內之後,我們就會發現所提交的作業並不在作業列表中,也就是說,是無法通過jobs來查看的。讓我們來看看為什麼這樣就能躲過 HUP 信號的影響吧。
示例:
[root@test ~]# (ping www.chinaunix.net &)
[root@test ~]# ps -ef |grep www.chinaunix.net
root 16270 1 0 14:13 pts/4 00:00:00 ping www.chinaunix.net
root 16278 15362 0 14:13 pts/4 00:00:00 grep www.chinaunix.net
[root@test ~]#
從上例中可以看出,新提交的進程的父 ID(PPID)為1(init 進程的 PID),並不是當前終端的進程 ID。因此並不屬於當前終端的子進程,從而也就不會受到當前終端的 HUP 信號的影響了。
三、業務場景3:
我們已經知道,如果事先在命令前加上 nohup 或者 setsid 就可以避免 HUP 信號的影響。但是如果我們未加任何處理就已經提交了命令,該如何補救才能讓它避免 HUP 信號的影響呢?
解決方法:
這時想加 nohup 或者 setsid 已經為時已晚,只能通過作業調度和 disown 來解決這個問題了。
靈活運用 CTRL-z
在我們的日常工作中,我們可以用 CTRL-z 來將當前進程掛起到後台暫停運行,執行一些別的操作,然後再用 fg 來將掛起的進程重新放回前台(也可用 bg 來將掛起的進程放在後台)繼續運行。這樣我們就可以在一個終端內靈活切換運行多個任務,這一點在調試代碼時尤為有用。因為將代碼編輯器掛起到後台再重新放回時,光標定位仍然停留在上次掛起時的位置,避免了重新定位的麻煩。
- 用disown -h special_job 來使某個作業忽略HUP信號;
- 用disown -ah 來使所有的作業都忽略HUP信號;
- 用disown -rh 來使正在運行的作業忽略HUP信號。
需要注意的是,當使用過 disown 之後,會將把目標作業從作業列表中移除,我們將不能再使用jobs來查看它,但是依然能夠用ps -ef查找到它。
但是還有一個問題,這種方法的操作對象是作業,如果我們在運行命令時在結尾加了”&”來使它成為一個作業並在後台運行,那麼就萬事大吉了,我們可以通過jobs命令來得到所有作業的列表。但是如果並沒有把當前命令作為作業來運行,如何才能得到它的作業號呢?答案就是用 CTRL-z!
CTRL-z 的用途就是將當前進程掛起(Suspend),然後我們就可以用jobs命令來查詢它的作業號,再用bg job_spec 來將它放入後台並繼續運行。需要注意的是,如果掛起會影響當前進程的運行結果,請慎用此方法。
示例1:(如果提交命令時已經用“&”將命令放入後台運行,則可以直接使用“disown”)
[root@test ]# cp -r file1 file2 &
[1] 4825
[root@test ]# jobs
[1]+ Running cp -i -r file1 file2 &
[root@test ]# disown -h %1
[root@test ]# ps -ef |grep cp
root 4825 968 1 09:46 pts/4 00:00:00 cp -i -r file1 file2
root 4853 968 0 09:46 pts/4 00:00:00 grep cp
[root@test ]# logout
示例2:(如果提交命令時未使用“&”將命令放入後台運行,可使用 CTRL-z 和“bg”將其放入後台,再使用“disown”)
[root@test ]# cp -r file1 file2
[1]+ Stopped cp -i -r file1 file2
[root@test ]# bg %1
[1]+ cp -i -r file1 file2&
[root@test ]# jobs
[1]+ Running cp -i -r file1 file2&
[root@test ]# disown -h %1
[root@test ]# ps -ef |grep cp
root 5790 5577 1 10:04 pts/3 00:00:00 cp -i -r file1 file2
root 5824 5577 0 10:05 pts/3 00:00:00 grep cp
[root@test ]#