天天看點

Linux Shell 通配符、元字元、轉義符

說到shell通配符(wildcard),大家在使用時候會經常用到。下面是一個執行個體:

[[email protected] ~/shell]$ ls
a.txt  b.txt  c.old

#2
           
[[email protected] ~/shell]$ ls *.txt
a.txt  b.txt

#3
           
[[email protected] ~/shell]$ ls d*.txt
ls: 無法通路 d*.txt: 沒有那個檔案或目錄
           

從上面這個執行個體,不知道大家有沒有發現問題呢。我們先了解一下,通配符相關知識,再分析下這個執行個體吧。

一、linux shell通配符(wildcard)

通配符是由shell處理的(不是由所涉及到指令語句處理的,其實我們在shell各個指令中也沒有發現有這些通配符介紹), 它隻會出現在 指令的“參數”裡(它不用在 指令名稱裡, 也不用在 操作符上)。當shell在“參數”中遇到了通配符時,shell會将其當作路徑或檔案名去在磁盤上搜尋可能的比對:若符合要求的比對存在,則進行代換(路徑擴充);否則就将該通配符作為一個普通字元傳遞給“指令”,然後再由指令進行處理。總之,通配符 實際上就是一種shell實作的路徑擴充功能。在 通配符被處理後, shell會先完成該指令的重組,然後再繼續處理重組後的指令,直至執行該指令。

我們回過頭分析上面指令吧:在第2個指令中,*.txt 實際shell搜尋檔案,找到了符合條件的檔案,指令會變成:ls a.txt b.txt ,實際在執行ls 時候傳給它的是a.txt b.txt .

而指令3,d*.txt 由于目前目錄下面沒有這樣的檔案或目錄,直接将”d*.txt” 作為ls 參數,傳給了 ls .這個時候”*” 隻是一個普通的 ls 參數而已,已經失去了它通配意義。 由于找不到檔案,是以會出現:無法通路提示!

了解了shell通配符,我們現在看下,shell常見通配符有那一些了。

shell常見通配符:

字元 含義 執行個體
* 比對 0 或多個字元 a*b  a與b之間可以有任意長度的任意字元, 也可以一個也沒有, 如aabcb, axyzb, a012b, ab。
? 比對任意一個字元 a?b  a與b之間必須也隻能有一個字元, 可以是任意字元, 如aab, abb, acb, a0b。
[list]  比對 list 中的任意單一字元 a[xyz]b   a與b之間必須也隻能有一個字元, 但隻能是 x 或 y 或 z, 如: axb, ayb, azb。
[!list]  比對 除list 中的任意單一字元 a[!0-9]b  a與b之間必須也隻能有一個字元, 但不能是阿拉伯數字, 如axb, aab, a-b。
[c1-c2] 比對 c1-c2 中的任意單一字元 如:[0-9] [a-z] a[0-9]b  0與9之間必須也隻能有一個字元 如a0b, a1b... a9b。
{string1,string2,...} 比對 sring1 或 string2 (或更多)其一字元串 a{abc,xyz,123}b    a與b之間隻能是abc或xyz或123這三個字元串之一。
需要說明的是:通配符看起來有點象正規表達式語句,但是它與正規表達式不同的,不能互相混淆。把通配符了解為shell 特殊代号字元就可。而且涉及的隻有,*,? [] ,{} 這幾種。

二、shell元字元(特殊字元 Meta)

shell 除了有通配符之外,由shell 負責預先先解析後,将處理結果傳給指令行之外,shell還有一系列自己的其他特殊字元。
字元 說明
IFS 由 <space> 或 <tab> 或 <enter> 三者之一組成(我們常用 space )。
CR 由 <enter> 産生。
= 設定變量。
$ 作變量或運算替換(請不要與 shell prompt 搞混了)。
> 重導向 stdout。 *
< 重導向 stdin。 *
| 指令管線。 *
& 重導向 file descriptor ,或将指令置于背境執行。 *
( ) 将其内的指令置于 nested subshell 執行,或用于運算或指令替換。 *
{ } 将其内的指令置于 non-named function 中執行,或用在變量替換的界定範圍。
; 在前一個指令結束時,而忽略其傳回值,繼續執行下一個指令。 *
&& 在前一個指令結束時,若傳回值為 true,繼續執行下一個指令。 *
|| 在前一個指令結束時,若傳回值為 false,繼續執行下一個指令。 *
! 執行 history 清單中的指令。*

加入”*” 都是作用在指令名直接。可以看到shell 元字元,基本是作用在指令上面,用作多指令分割(或者參數分割)。是以看到與通配符有相同的字元,但是實際上作用範圍不同。是以不會出現混淆。

以下是man bash 得到的英文解析:

metacharacter

              A character that, when unquoted, separates words.  One of the following:

              |  & ; ( ) < > space tab

control operator

              A token that performs a control function.  It is one of the following symbols:

              || & && ; ;; ( ) | <newline>

三、shell轉義符

有時候,我們想讓 通配符,或者元字元 變成普通字元,不需要使用它。那麼這裡我們就需要用到轉義符了。 shell提供轉義符有三種。
字元 說明
‘’(單引号) 又叫硬轉義,其内部所有的shell 元字元、通配符都會被關掉。注意,硬轉義中不允許出現’(單引号)。
“”(雙引号) 又叫軟轉義,其内部隻允許出現特定的shell 元字元:$用于參數代換 `用于指令代替
\(反斜杠)   又叫轉義,去除其後緊跟的元字元或通配符的特殊意義。

man bash 英文解釋如下:

There are three quoting mechanisms: the escape character, single quotes, and double quotes.

執行個體:

[[email protected] ~/shell]$ ls \*.txt
ls: 無法通路 *.txt: 沒有那個檔案或目錄

[[email protected] ~/shell]$ ls '*.txt'
ls: 無法通路 *.txt: 沒有那個檔案或目錄

[[email protected] ~/shell]$ ls 'a.txt'
a.txt

[[email protected] ~/shell]$ ls *.txt
a.txt  b.txt
           
可以看到,加入了轉義符 “*”已經失去了通配符意義了。

四、shell解析腳本的過程

看到上面說的這些,想必大家會問到這個問題是,有這麼想特殊字元,通配符,那麼 shell在得到一條指令,到達是怎麼樣處理的呢?我們看下下面的圖:
Linux Shell 通配符、元字元、轉義符
如果用雙引号包括起來,shell檢測跳過了1-4步和9-10步,單引号包括起來,shell檢測就會跳過了1-10步。也就是說,雙引号 隻經過參數擴充、指令代換和算術代換就可以送入執行步驟,而單引号轉義符直接會被送入執行步驟。而且,無論是雙引号轉義符還是單引号轉義符在執行的時候能夠告訴各個指令自身内部是一體的,但是其本身在執行時是并不是指令中文本的一部分。

繼續閱讀