天天看點

UNIX 高手的 10 個習慣

采用 10 個能夠提高您的 unix 指令行效率的好習慣——并在此過程中擺脫不良的使用模式。本文循序漸進地指導您學習幾項用于指令行操作的技術,這些技術非常好,但是通常被忽略。了解常見錯誤和克服它們的方法,以便您能夠确切了解為何值得采用這些 unix 習慣。

當您經常使用某個系統時,往往會陷入某種固定的使用模式。有時,您沒有養成以盡可能最好的方式做事的習慣。有時,您的不良習慣甚至會導緻出現混亂。糾正此類缺點的最佳方法之一,就是有意識地采用抵制這些壞習慣的好習慣。本文提出了 10 個值得采用的 unix 指令行習慣——幫助您克服許多常見使用怪癖,并在該過程中提高指令行工作效率的好習慣。下面列出了這 10 個好習慣,之後對進行了更詳細的描述。

要采用的十個好習慣為:

在單個指令中建立目錄樹。

更改路徑;不要移動存檔。

将指令與控制操作符組合使用。

謹慎引用變量。

使用轉義序列來管理較長的輸入。

在清單中對指令分組。

在 <code>find</code> 之外使用 <code>xargs</code>。

了解何時 <code>grep</code> 應該執行計數——何時應該繞過。

比對輸出中的某些字段,而不隻是對行進行比對。

停止對 <code>cat</code> 使用管道。

清單 1 示範了最常見的 unix 壞習慣之一:一次定義一個目錄樹。

1

2

3

4

5

6

7

8

9

<code>~ $</code><code>mkdir</code>

<code>tmp</code>

<code>~ $</code><code>cd</code>

<code>~</code><code>/tmp</code>

<code>$</code><code>mkdir</code> <code>a</code>

<code>$</code><code>cd</code> <code>a</code>

<code>~</code><code>/tmp/a</code>

<code>$</code><code>mkdir</code> <code>b</code>

<code>$</code><code>cd</code> <code>b</code>

<code>~</code><code>/tmp/a/b/</code>

<code>$</code><code>mkdir</code> <code>c</code>

<code>$</code><code>cd</code> <code>c</code>

<code>~</code><code>/tmp/a/b/c</code>

<code>$</code>

使用 <code>mkdir</code> 的 <code>-p</code> 選項并在單個指令中建立所有父目錄及其子目錄要容易得多。但是即使對于知道此選項的管理者,他們在指令行上建立子目錄時也仍然束縛于逐漸建立每級子目錄。花時間有意識地養成這個好習慣是值得的:

<code>-p tmp</code><code>/a/b/c</code>

您可以使用此選項來建立整個複雜的目錄樹(在腳本中使用是非常理想的),而不隻是建立簡單的層次結構。例如:

<code>-p project/{lib</code><code>/ext</code><code>,bin,src,doc/{html,info,pdf},demo</code><code>/stat/a</code><code>}</code>

過去,單獨定義目錄的唯一借口是您的 <code>mkdir</code> 實作不支援此選項,但是在大多數系統上不再是這樣了。ibm、aix 、<code>mkdir</code>、gnu

<code>mkdir</code> 和其他遵守單一 unix 規範 (single unix specification) 的系統現在都具有此選項。

對于仍然缺乏該功能的少數系統,您可以使用 <code>mkdirhier</code> 腳本,此腳本是執行相同功能的 <code>mkdir</code> 的包裝:

<code>~ $ mkdirhier project/{lib</code><code>/ext</code><code>,bin,src,doc/{html,info,pdf},demo</code><code>/stat/a</code><code>}</code>

另一個不良的使用模式是将 .tar 存檔檔案移動到某個目錄,因為該目錄恰好是您希望在其中提取 .tar 檔案的目錄。其實您根本不需要這樣做。您可以随心所欲地将任何 .tar 存檔檔案解壓縮到任何目錄——這就是

<code>-c</code> 選項的用途。在解壓縮某個存檔檔案時,使用 <code>-c</code> 選項來指定要在其中解壓縮該檔案的目錄:

<code>~ $</code><code>tar</code>

<code>xvf -c tmp</code><code>/a/b/c</code>

<code>newarc.</code><code>tar</code><code>.gz</code>

相對于将存檔檔案移動到您希望在其中解壓縮它的位置,切換到該目錄,然後才解壓縮它,養成使用 <code>-c</code> 的習慣則更加可取——當存檔檔案位于其他某個位置時尤其如此。

您可能已經知道,在大多數 shell 中,您可以在單個指令行上通過在指令之間放置一個分号 (;) 來組合指令。該分号是 shell 控制操作符,雖然它對于在單個指令行上将離散的指令串聯起來很有用,但它并不适用于所有情況。例如,假設您使用分号來組合兩個指令,其中第二個指令的正确執行完全依賴于第一個指令的成功完成。如果第一個指令未按您預期的那樣退出,第二個指令仍然會運作——結果會導緻失敗。相反,應該使用更适當的控制操作符(本文将描述其中的部分操作符)。隻要您的 shell 支援它們,就值得養成使用它們的習慣。

使用 <code>&amp;&amp;</code> 控制操作符來組合兩個指令,以便僅當 第一個指令傳回零退出狀态時才運作第二個指令。換句話說,如果第一個指令運作成功,則第二個指令将運作。如果第一個指令失敗,則第二個指令根本就不運作。例如:

<code>tmp</code><code>/a/b/c</code> <code>&amp;&amp;</code><code>tar</code> <code>xvf ~</code><code>/archive</code><code>.</code><code>tar</code>

在此例中,存檔的内容将提取到 ~/tmp/a/b/c 目錄中,除非該目錄不存在。如果該目錄不存在,則 <code>tar</code> 指令不會運作,是以不會提取任何内容。

類似地,<code>||</code> 控制操作符分隔兩個指令,并且僅當第一個指令傳回非零退出狀态時才運作第二個指令。換句話說,如果第一個指令成功,則第二個指令不會運作。如果第一個指令失敗,則第二個指令才會 運作。在測試某個給定目錄是否存在時,通常使用此操作符,如果該目錄不存在,則建立它:

<code>tmp</code><code>/a/b/c</code> <code>||</code><code>mkdir</code> <code>-p tmp</code><code>/a/b/c</code>

您還可以組合使用本部分中描述的控制操作符。每個操作符都影響最後的指令運作:

<code>&amp;&amp;</code><code>tar</code> <code>xvf -c tmp</code><code>/a/b/c</code> <code>~</code><code>/archive</code><code>.</code><code>tar</code>

始終要謹慎使用 shell 擴充和變量名稱。一般最好将變量調用包括在雙引号中,除非您有不這樣做的足夠理由。類似地,如果您直接在字母數字文本後面使用變量名稱,則還要確定将該變量名稱包括在方括号 ([]) 中,以使其與周圍的文本區分開來。否則,shell 将把尾随文本解釋為變量名稱的一部分——并且很可能傳回一個空值。清單 8 提供了變量的各種引用和非引用及其影響的示例。

10

11

12

13

14

15

16

<code>~ $</code><code>ls</code>

<code>tmp/</code>

<code>a b</code>

<code>~ $ var=</code><code>"tmp/*"</code>

<code>~ $</code><code>echo</code>

<code>$var</code>

<code>tmp</code><code>/a</code>

<code>tmp</code><code>/b</code>

<code>"$var"</code>

<code>tmp/*</code>

<code>$vara</code>

<code>"$vara"</code>

<code>"${var}a"</code>

<code>tmp/*a</code>

<code>${var}a</code>

<code>~ $</code>

您或許看到過使用反斜杠 ($$ 來将較長的行延續到下一行的代碼示例,并且您知道大多數 shell 都将您通過反斜杠聯接的後續行上鍵入的内容視為單個長行。然而,您可能沒有在指令行中像通常那樣利用此功能。如果您的終端無法正确處理多行回繞,或者您的指令行比通常小(例如在提示符下有長路經的時候),反斜杠就特别有用。反斜杠對于了解鍵入的長輸入行的含義也非常有用,如以下示例所示:

<code>tmp</code><code>/a/b/c</code> <code>|| \</code>

<code>&gt;</code><code>mkdir</code>

<code>-p tmp</code><code>/a/b/c</code> <code>&amp;&amp; \</code>

<code>&gt;</code><code>tar</code>

<code>~</code><code>/archive</code><code>.</code><code>tar</code>

或者,也可以使用以下配置:

<code>tmp</code><code>/a/b/c</code> <code>\</code>

<code>&gt;                 || \</code>

<code>-p tmp</code><code>/a/b/c</code> <code>\</code>

<code>&gt;                    &amp;&amp; \</code>

然而,當您将輸入行劃分到多行上時,shell 始終将其視為單個連續的行,因為它總是删除所有反斜杠和額外的空格。

注意:在大多數 shell 中,當您按向上箭頭鍵時,整個多行輸入将重繪到單個長輸入行上。

大多數 shell 都具有在清單中對指令分組的方法,以便您能将它們的合計輸出向下傳遞到某個管道,或者将其任何部分或全部流重定向到相同的地方。您一般可以通過在某個 subshell 中運作一個指令清單或通過在目前 shell 中運作一個指令清單來實作此目的。

使用括号将指令清單包括在單個組中。這樣做将在一個新的 subshell 中運作指令,并允許您重定向或收集整組指令的輸出,如以下示例所示:

<code>~ $ (</code><code>cd</code>

<code>tmp</code><code>/a/b/c/</code> <code>||</code><code>mkdir</code> <code>-p tmp</code><code>/a/b/c</code>

<code>&amp;&amp; \</code>

<code>&gt; var=$pwd;</code>

<code>cd</code> <code>~;</code><code>tar</code>

<code>xvf -c $var archive.</code><code>tar</code>

<code>) \</code>

<code>&gt; | mailx admin -s</code><code>"archive contents"</code>

在此示例中,該存檔的内容将提取到 tmp/a/b/c/ 目錄中,同時将分組指令的輸出(包括所提取檔案的清單)通過郵件發送到位址 <code>admin</code>。

當您在指令清單中重新定義環境變量,并且您不希望将那些定義應用于目前 shell 時,使用 subshell 更可取。

将指令清單用大括号 ({}) 括起來,以在目前 shell 中運作。確定在括号與實際指令之間包括空格,否則 shell 可能無法正确解釋括号。此外,還要確定清單中的最後一個指令以分号結尾,如以下示例所示:

<code>~ $ {</code><code>cp</code>

<code>${var}a . &amp;&amp;</code><code>chown</code>

<code>-r guest.guest a &amp;&amp; \</code>

<code>cvf newarchive.</code><code>tar</code>

<code>a; } | mailx admin -s</code><code>"new archive"</code>

使用 <code>xargs</code> 工具作為篩選器,以充分利用從 <code>find</code> 指令挑選的輸出。<code>find</code> 運作通常提供與某些條件比對的檔案清單。此清單被傳遞到

<code>xargs</code>上,後者然後使用該檔案清單作為參數來運作其他某些有用的指令,如以下示例所示:

<code>~ $</code><code>find</code>

<code>some-</code><code>file</code><code>-criteria some-</code><code>file</code><code>-path | \</code>

<code>&gt;</code><code>xargs</code>

<code>some-great-</code><code>command</code><code>-that-needs-filename-arguments</code>

然而,不要将 <code>xargs</code> 僅看作是 <code>find</code> 的輔助工具;它是一個未得到充分利用的工具之一,當您養成使用它的習慣時,将會希望進行所有試驗,包括以下用法。

在最簡單的調用形式中,<code>xargs</code> 就像一個篩選器,它接受一個清單(每個成員分别在單獨的行上)作為輸入。該工具将那些成員放置在單個空格分隔的行上:

<code>~ $ xargsabccontrol-d</code>

<code>a b c</code>

您可以發送通過 <code>xargs</code> 來輸出檔案名的任何工具的輸出,以便為其他某些接受檔案名作為參數的工具獲得參數清單,如以下示例所示:

<code>$</code><code>ls</code> <code>-1 |</code><code>xargs</code>

<code>december_report.pdf readme a archive.</code><code>tar</code>

<code>mkdirhier.sh</code>

<code>$</code><code>ls</code> <code>-1 |</code><code>xargs</code> <code>file</code>

<code>december_report.pdf: pdf document, version 1.3</code>

<code>readme: ascii text</code>

<code>a: directory</code>

<code>archive.</code><code>tar</code><code>: posix</code><code>tar</code> <code>archive</code>

<code>mkdirhier.sh: bourne shell script text executable</code>

<code>xargs</code> 指令不隻用于傳遞檔案名。您還可以在需要将文本篩選到單個行中的任何時候使用它:

<code>$</code><code>ls</code> <code>-l |</code><code>xargs</code>

<code>-rw-r--r-- 7 joe joe 12043 jan 27 20:36 december_report.pdf -rw-r--r-- 1 \</code>

<code>root root 238 dec 03 08:19 readme drwxr-xr-x 38 joe joe 354082 nov 02 \</code>

<code>16:07 a -rw-r--r-- 3 joe joe 5096 dec 14 14:26 archive.</code><code>tar</code>

<code>-rwxr-xr-x 1 \</code>

<code>joe joe 3239 sep 30 12:40 mkdirhier.sh</code>

從技術上講,使用 <code>xargs</code> 很少遇到麻煩。預設情況下,檔案結束字元串是下劃線 (_);如果将該字元作為單個輸入參數來發送,則它之後的所有内容将被忽略。為了防止這種情況發生,可以使用

<code>-e</code> 标志,它在不帶參數的情況下完全禁用結束字元串。

避免通過管道将 <code>grep</code> 發送到 <code>wc -l</code> 來對輸出行數計數。<code>grep</code> 的 <code>-c</code> 選項提供了對與特定模式比對的行的計數,并且一般要比通過管道發送到<code>wc</code> 更快,如以下示例所示:

<code>~ $</code><code>time</code>

<code>grep</code> <code>and tmp</code><code>/a/longfile</code><code>.txt |</code><code>wc</code> <code>-l</code>

<code>2811</code>

<code>real    0m0.097s</code>

<code>user    0m0.006s</code>

<code>sys     0m0.032s</code>

<code>grep</code> <code>-c and tmp</code><code>/a/longfile</code><code>.txt</code>

<code>real    0m0.013s</code>

<code>sys     0m0.005s</code>

除了速度因素外,<code>-c</code> 選項還是執行計數的好方法。對于多個檔案,帶 <code>-c</code> 選項的 <code>grep</code> 傳回每個檔案的單獨計數,每行一個計數,而針對

<code>wc</code> 的管道則提供所有檔案的組合總計數。

然而,不管是否考慮速度,此示例都表明了另一個要避免地常見錯誤。這些計數方法僅提供包含比對模式的行數——如果那就是您要查找的結果,這沒什麼問題。但是在行中具有某個特定模式的多個執行個體的情況下,這些方法無法為您提供實際比對執行個體數量 的真實計數。歸根結底,若要對執行個體計數,您還是要使用

<code>wc</code> 來計數。首先,使用 <code>-o</code> 選項(如果您的版本支援它的話)來運作 <code>grep</code> 指令。此選項僅 輸出比對的模式,每行一個模式,而不輸出行本身。但是您不能将它與

<code>-c</code> 選項結合使用,是以要使用 <code>wc -l</code> 來對行計數,如以下示例所示:

<code>~ $</code><code>grep</code>

<code>-o and tmp</code><code>/a/longfile</code><code>.txt |</code><code>wc</code> <code>-l</code>

<code>3402</code>

在此例中,調用 <code>wc</code> 要比第二次調用 <code>grep</code> 并插入一個虛拟模式(例如 <code>grep -c</code>)來對行進行比對和計數稍快一點。

當您隻希望比對輸出行中特定字段 中的模式時,諸如 <code>awk</code> 等工具要優于 <code>grep</code>。

下面經過簡化的示例示範了如何僅列出 12 月修改過的檔案。

<code>$</code><code>ls</code> <code>-l</code><code>/tmp/a/b/c</code> <code>|</code><code>grep</code> <code>dec</code>

<code>-rw-r--r--  7 joe joe  12043 jan 27 20:36 december_report.pdf</code>

<code>-rw-r--r--  1 root root  238 dec 03 08:19 readme</code>

<code>-rw-r--r--  3 joe joe   5096 dec 14 14:26 archive.</code><code>tar</code>

在此示例中,<code>grep</code> 對行進行篩選,并輸出其修改日期和名稱中帶 <code>dec</code> 的所有檔案。是以,諸如 december_report.pdf 等檔案是比對的,即使它自從一月份以來還未修改過。這可能不是您希望的結果。為了比對特定字段中的模式,最好使用

<code>awk</code>,其中的一個關系運算符對确切的字段進行比對,如以下示例所示:

<code>$</code><code>ls</code> <code>-l |</code><code>awk</code> <code>'$6 == "dec"'</code>

<code>grep</code> 的一個常見的基本用法錯誤是通過管道将 <code>cat</code> 的輸出發送到 <code>grep</code> 以搜尋單個檔案的内容。這絕對是不必要的,純粹是浪費時間,因為諸如

<code>grep</code> 這樣的工具接受檔案名作為參數。您根本不需要在這種情況下使用 <code>cat</code>,如以下示例所示:

<code>cat</code> <code>tmp</code><code>/a/longfile</code><code>.txt |</code><code>grep</code> <code>and</code>

<code>real    0m0.015s</code>

<code>user    0m0.003s</code>

<code>sys     0m0.013s</code>

<code>grep</code> <code>and tmp</code><code>/a/longfile</code><code>.txt</code>

<code>real    0m0.010s</code>

<code>sys     0m0.004s</code>

此錯誤存在于許多工具中。由于大多數工具都接受使用連字元 (-) 的标準輸入作為一個參數,是以即使使用 <code>cat</code> 來分散 <code>stdin</code> 中的多個檔案,參數也通常是無效的。僅當您使用帶多個篩選選項之一的 <code>cat</code> 時,才真正有必要在管道前首先執行連接配接。

最好檢查一下您的指令行習慣中的任何不良的使用模式。不良的使用模式會降低您的速度,并且通常會導緻意外錯誤。本文介紹了 10 個新習慣,它們可以幫助您擺脫許多最常見的使用錯誤。養成這些好習慣是加強您的 unix 指令行技能的積極步驟。