天天看點

linux指令--grep指令linux指令—grep指令

linux指令—grep指令

簡介

grep (global search regular expression(RE) and print out the line,全面搜尋正規表達式并把行列印出來)是一種強大的文本搜尋工具,它能使用正規表達式搜尋文本,并把比對的行列印出來。

Unix的grep家族包括grep、egrep和fgrep。egrep和fgrep的指令隻跟grep有很小不同。egrep是grep的擴充,支援更多的re元字元, fgrep就是fixed grep或fast grep,它們把所有的字母都看作單詞,也就是說,正規表達式中的元字元表示回其自身的字面意義,不再特殊。linux使用GNU版本的grep。它功能更強,可以通過-G、-E、-F指令行選項來使用egrep和fgrep的功能。

grep的工作方式是這樣的,它在一個或多個檔案中搜尋字元串模闆。如果模闆包括空格,則必須被引用,模闆後的所有字元串被看作檔案名。搜尋的結果被送到标準輸出,不影響原檔案内容。grep可用于shell腳本,因為grep通過傳回一個狀态值來說明搜尋的狀态,如果模闆搜尋成功,則傳回0,如果搜尋不成功,則傳回1,如果搜尋的檔案不存在,則傳回2。我們利用這些傳回值就可進行一些自動化的文本處理工作。

指令格式

指令格式:grep [option] pattern file

複制代碼

grep的常用選項:

-V: 列印grep的版本号

-E: 解釋PATTERN作為擴充正規表達式,也就相當于使用egrep。 或操作

-F : 解釋PATTERN作為固定字元串的清單,由換行符分隔,其中任何一個都要比對。也就相當于使用fgrep。

-G: 将範本樣式視為普通的表示法來使用。這是預設值。加不加都是使用grep。

比對控制選項:

-e : 使用PATTERN作為模式。這可以用于指定多個搜尋模式,或保護以連字元( - )開頭的圖案。指定字元串做為查找檔案内容的樣式。

-f : 指定規則檔案,其内容含有一個或多個規則樣式,讓grep查找符合規則條件的檔案内容,格式為每行一個規則樣式。

-i : 搜尋時候忽略大小寫

-v: 反轉比對,選擇沒有被比對到的内容。

-w:比對整詞,精确地單詞,單詞的兩邊必須是非字元符号(即不能是字母數字或下劃線)

-x:僅選擇與整行完全比對的比對項。精确比對整行内容(包括行首行尾那些看不到的空格内容都要完全比對)

-y:此參數的效果和指定“-i”參數相同。

一般輸出控制選項:

-c: 抑制正常輸出;而是為每個輸入檔案列印比對線的計數。

–color [= WHEN]:讓關鍵字高亮顯示,如–color=auto

-L:列出檔案内容不符合指定的範本樣式的檔案名稱

-l : 列出檔案内容符合指定的範本樣式的檔案名稱。

-m num:當比對内容的行數達到num行後,grep停止搜尋,并輸出停止前搜尋到的比對内容

-o: 隻輸出比對的具體字元串,比對行中其他内容不會輸出

-q:安靜模式,不會有任何輸出内容,查找到比對内容會傳回0,未查找到比對内容就傳回非0

-s:不會輸出查找過程中出現的任何錯誤消息,-q和-s選項因為與其他系統的grep有相容問題,shell腳本應該避免使用-q和-s,并且應該将标準和錯誤輸出重定向到/dev/null 代替。

輸出線字首控制:

-b:輸出每一個比對行(或比對的字元串)時在其前附加上偏移量(從檔案第一個字元到該比對内容之間的位元組數)

-H:在每一個比對行之前加上檔案名一起輸出(針對于查找單個檔案),當查找多個檔案時預設就會輸出檔案名

-h:禁止輸出上的檔案名的字首。無論查找幾個檔案都不會在比對内容前輸出檔案名

–label = LABEL:顯示實際來自标準輸入的輸入作為來自檔案LABEL的輸入。這是特别在實作zgrep等工具時非常有用,例如gzip -cd foo.gz | grep --label = foo -H的東西。看到 也是-H選項。

-n:輸出比對内容的同時輸出其所在行号。

-T:初始标簽確定實際行内容的第一個字元位于制表位上,以便對齊标簽看起來很正常。在比對資訊和其前的附加資訊之間加入tab以使格式整齊。

上下文線控制選項:

-A num:比對到搜尋到的行以及該行下面的num行

-B num:比對到搜尋到的行以及該行上面的num行

-C num:比對到搜尋到的行以及上下各num行

檔案和目錄選擇選項:

-a: 處理二進制檔案,就像它是文本;這相當于–binary-files = text選項。不忽略二進制的資料。

–binary-files = TYPE:如果檔案的前幾個位元組訓示檔案包含二進制資料,則假定該檔案為類型TYPE。預設情況下,TYPE是二進制的,grep通常輸出一行消息二進制檔案比對,或者如果沒有比對則沒有消息。如果TYPE不比對,grep假定二進制檔案不比對;這相當于-I選項。如果TYPE是文本,則grep處理a二進制檔案,如果它是文本;這相當于-a選項。警告:grep --binary-files = text可能會輸出二進制的垃圾,如果輸出是一個終端和如果可能有讨厭的副作用終端驅動程式将其中的一些解釋為指令。

-D:如果輸入檔案是裝置,FIFO或套接字,請使用ACTION處理。預設情況下,讀取ACTION,這意味着裝置被讀取,就像它們是普通檔案一樣。如果跳過ACTION,裝置為 默默地跳過。

-d: 如果輸入檔案是目錄,請使用ACTION處理它。預設情況下,ACTION是讀的,這意味着目錄被讀取,就像它們是普通檔案一樣。如果跳過ACTION,目錄将靜默跳過。如果ACTION是recurse,grep将遞歸讀取每個目錄下的所有檔案;這是相當于-r選項。

–exclude=GLOB:跳過基本名稱與GLOB比對的檔案(使用通配符比對)。檔案名glob可以使用*,?和[…]作為通配符,和\引用通配符或反斜杠字元。搜尋其檔案名和GLOB通配符相比對的檔案的内容來查找比對使用方法:grep -H --exclude=c* “old” ./* c是通配檔案名的通配符./ 指定需要先通配檔案名的檔案的範圍,必須要給*,不然就比對不出内容,(如果不給*,帶上-r選項也可以比對)

–exclude-from = FILE:在檔案中編寫通配方案,grep将不會到比對方案中檔案名的檔案去查找比對内容

–exclude-dir = DIR:比對一個目錄下的很多内容同時還要讓一些子目錄不接受比對,就使用此選項。

–include = GLOB:僅搜尋其基本名稱與GLOB比對的檔案(使用–exclude下所述的通配符比對)。

-R ,-r :以遞歸方式讀取每個目錄下的所有檔案; 這相當于-d recurse選項。

其他選項:

–line-buffered: 在輸出上使用行緩沖。這可能會導緻性能損失。

–mmap:啟用mmap系統調用代替read系統調用

-U:将檔案視為二進制。

-z:将輸入視為一組行,每一行由一個零位元組(ASCII NUL字元)而不是a終止新隊。與-Z或–null選項一樣,此選項可以與排序-z等指令一起使用來處理任意檔案名。

複制代碼

簡述

複制代碼

-a --text #不要忽略二進制的資料。 将 binary 檔案以 text 檔案的方式搜尋資料

-A<顯示行數> --after-context=<顯示行數> #除了顯示符合範本樣式的那一列之外,并顯示該行之後的内容。

-b --byte-offset #在顯示符合樣式的那一行之前,标示出該行第一個字元的編号。

-B<顯示行數> --before-context=<顯示行數> #除了顯示符合樣式的那一行之外,并顯示該行之前的内容。

-c --count #計算符合樣式的行數。

-C<顯示行數> --context=<顯示行數>或-<顯示行數> #除了顯示符合樣式的那一行之外,并顯示該行之前後的内容。

-d <動作> --directories=<動作> #當指定要查找的是目錄而非檔案時,必須使用這項參數,否則grep指令将回報資訊并停止動作。

-e<範本樣式> --regexp=<範本樣式> #指定字元串做為查找檔案内容的樣式。

-E --extended-regexp #将樣式為延伸的普通表示法來使用。

-f<規則檔案> --file=<規則檔案> #指定規則檔案,其内容含有一個或多個規則樣式,讓grep查找符合規則條件的檔案内容,格式為每行一個規則樣式。

-F --fixed-regexp #将樣式視為固定字元串的清單。

-G --basic-regexp #将樣式視為普通的表示法來使用。

-h --no-filename #在顯示符合樣式的那一行之前,不标示該行所屬的檔案名稱。

-H --with-filename #在顯示符合樣式的那一行之前,表示該行所屬的檔案名稱。

-i --ignore-case #忽略字元大小寫的差别。

-l --file-with-matches #列出檔案内容符合指定的樣式的檔案名稱。

-L --files-without-match #列出檔案内容不符合指定的樣式的檔案名稱。

-n --line-number #在顯示符合樣式的那一行之前,标示出該行的列數編号。

-q --quiet或–silent #不顯示任何資訊。

-r --recursive #此參數的效果和指定“-d recurse”參數相同。

-s --no-messages #不顯示錯誤資訊。

-v --revert-match #顯示不包含比對文本的所有行。

-V --version #顯示版本資訊。

-w --word-regexp #隻顯示全字元合的列。

-x --line-regexp #隻顯示全列符合的列。

-y #此參數的效果和指定“-i”參數相同。

–color=auto :可以将找到的關鍵詞部分加上顔色的顯示

複制代碼

使用執行個體:

一、常用用法

複制代碼

grep -i pattern files :不區分大小寫地搜尋。預設情況區分大小寫,

grep -l pattern files :隻列出比對的檔案名,

grep -L pattern files :列出不比對的檔案名,

grep -w pattern files :隻比對整個單詞,而不是字元串的一部分(如比對‘magic’,而不是‘magical’),

grep -C number pattern files :比對的上下文分别顯示[number]行,

grep pattern1 | pattern2 files :顯示比對 pattern1 或 pattern2 的行,

grep pattern1 files | grep pattern2 :顯示既比對 pattern1 又比對 pattern2 的行。

這裡還有些用于搜尋的特殊符号:

< 和 > 分别标注單詞的開始與結尾。

例如:

grep man * 會比對 ‘Batman’、‘manic’、‘man’等,

grep ‘<man’ * 比對‘manic’和‘man’,但不是‘Batman’,

grep ‘’ 隻比對‘man’,而不是‘Batman’或‘manic’等其他的字元串。

‘^’:指比對的字元串在行首,

‘$’:指比對的字元串在行尾,

如果您不習慣指令行參數,可以試試圖形界面的‘grep’,如 reXgrep 。這個軟體提供 AND、OR、NOT 等文法,還有漂亮的按鈕 ? 。如果您隻是需要更清楚的輸出,不妨試試 fungrep 。

.grep 搜尋字元串

指令格式:

grep string filename

尋找字串的方法很多,比如說我想找所有以M開頭的行.此時必須引進pattern的觀

念.以下是一些簡單的□例,以及說明:

^M 以M開頭的行,^表示開始的意思

M$ 以M結尾的行,$表示結束的意思

1 以數字開始的行,[]内可列舉字母

2 以1,2,4,a,或b開頭的行

^b.503 句點表示任一字母

  • 星号表示0個以上的字母(可以沒有)
  • 加号表示1個以上的字母

    . 斜線可以去掉特殊意義

    cat passwd | grep ^b 列出大學部有申請帳号者名單

    cat passwd | grep ^s 列出交換學生申請帳号者名單

    cat passwd | grep ‘^b.503’ 列出電機系各年級…

    grep ‘^.’ myfile.txt 列出所有以句點開頭的行

    複制代碼

1、查找指定程序

指令:ps -ef|grep java

2、查找指定程序個數

指令:ps -ef|grep -c java

或ps -ef|grep java -c

3、從檔案中讀取關鍵詞進行搜尋,預設是顯示的是行

指令1:cat test.txt | grep -f test2.txt

指令2(顯示行号):cat test.txt | grep -nf test2.txt

作用:輸出test.txt檔案中含有從test2.txt檔案中讀取出的關鍵詞的内容行,可用于按指定關鍵詞(放到一個檔案中)搜尋日志檔案。

另一種用法:将多個檔案之間相同的行輸出來

cd /etc/sysconfig/network-scripts/

grep “IPADDR” ifcfg-eth0 ifcfg-lo #預設不加參數指定過濾關鍵字,外加多個檔案,隻是将多個檔案裡面有比對的行輸出

ifcfg-eth0:IPADDR=192.168.1.108

ifcfg-lo:IPADDR=127.0.0.1

grep -f ifcfg-eth0 ifcfg-lo #grep -f 檔案1 檔案2 ,會将多個檔案之間相同的行輸出出來

ONBOOT=yes

-o:隻顯示被模式比對到的字元串,而不是整個行

指令:grep -o “you” ab.log

grep “root” /etc/passwd #先看下正常的過濾,會将整個一行過濾出來

root❌0:0:root:/root:/bin/bash

operator❌11:0:operator:/root:/sbin/nologin

grep -o “root” /etc/passwd #加o之後的操作,隻過濾關鍵字出來

root

root

root

root

grep -o “root:.*0” /etc/passwd #加上正規表達式,這樣才是正确的用法,不用輸出一整行,隻是輸出一小段

root❌0:0

grep -o “root” -b /etc/passwd

-b和-o一般是配合使用的,一行中字元串的字元是從該行的第一個字元開始計算,起始值為0。這裡左邊的數字就是此關鍵字在此檔案中的起始位置,第一個root出現在0位置,然後字元字母有一個算一個,你就一個個的向右數吧,下一個root出現在11位置以此類推。

0:root

11:root

17:root

414:root

4、從檔案中查找關鍵詞,忽略大小寫,預設情況區分大小寫

指令1:grep ‘linux’ test.txt

指令2(從多個檔案中查找):grep ‘linux’ test.txt test2.txt

多檔案時,輸出查詢到的資訊内容行時,會把檔案的命名在行最前面輸出并且加上":"作為标示符

指令3(忽略大小寫):grep -i ‘linux’ test.txt

指令:find . -name “.log” | grep -i error | grep -vi “info”

1)使用find -name 來列出所有log檔案,重定向給grep

2)使用grep -i 來查找包含error的行

3)使用grep -vi 來查找不包含info的行

5、grep不顯示本身

指令:

ps aux|grep [s]sh

ps aux | grep ssh | grep -v “grep” #不包含grep ssh這條指令

grep -v root /etc/passwd | grep -v nologin #将/etc/passwd,将沒有出現 root 和nologin的行取出來

6、-r 遞歸查找子目錄

查找目前目錄及其子目錄下面包含比對字元的檔案

複制代碼

grep ‘ab’ * #在目前目錄搜尋帶’ab’行的檔案

grep -r ‘ab’ * #在目前目錄及其子目錄下搜尋’ab’行的檔案

grep -l -r ‘ab’ * #在目前目錄及其子目錄下搜尋’ab’行的檔案,但是不顯示比對的行,隻顯示比對的檔案

grep -nr BLOG* . # 查找子目錄,比對後輸出行号,這裡的點表示目前目錄

grep -lr BLOG* . #查找子目錄,比對後隻輸出檔案名

複制代碼

查詢不包含某個目錄

#grep -R --exclude-dir=node_modules ‘some pattern’ /path/to/search #不包含txt目錄

7、列出關鍵字所在行的前幾行與後幾行也一起顯示

-A -B -C

很多時候,我們并關心比對行而是關心比對行的上下文。這時候-A -B -C就有用了

-A n 後n行,A記憶為(After)

-B n 前n行,B記憶為(Before)

-C n 前n行,後n行,C記憶為(Center)

複制代碼

[[email protected] ~]# dmesg | grep -n -A3 -B2 --color=auto ‘eth’

245-PCI: setting IRQ 10 as level-triggered

246-ACPI: PCI Interrupt 0000:00:0e.0[A] -> Link [LNKB] …

247:eth0: RealTek RTL8139 at 0xee846000, 00:90:cc:a6:34:84, IRQ 10

248:eth0: Identified 8139 chip type ‘RTL-8139C’

249-input: PC Speaker as /class/input/input2

250-ACPI: PCI Interrupt 0000:00:01.4[B] -> Link [LNKB] …

251-hdb: ATAPI 48X DVD-ROM DVD-R-RAM CD-R/RW drive, 2048kB Cache, UDMA(66)

如上所示,你會發現關鍵字 247 所在的前兩行及 248 後三行也都被顯示出來!

複制代碼

8、–line-buffered 打開buffering 模式

有一個檔案是動态的,它不斷地添加資訊到檔案的尾部,而你想要輸出包含某些資訊的行。即持續的grep一個動态的流

9、e與E差別

grep想同時過濾多個條件或操作

錯誤寫法:

netstat -an|grep “ESTABLISHED|WAIT” #預設grep不支援多條件比對

正确寫法:

netstat -an|grep -E “ESTABLISHED|WAIT” #加上-E 多條件用""包起來,然後多條件之間用|管道符分開

tcp 0 52 192.168.1.108:22 192.168.1.104:54127 ESTABLISHED

ps -aux|grep -e udevd -e master|awk {‘print $(NF-1)’}|sort|uniq #而-e呢不用""包起來,-e 指定一個比對條件

/sbin/udevd

/usr/bin/salt-master

grep -E ‘123|abc’ filename // 找出檔案(filename)中包含123或者包含abc的行

egrep ‘123|abc’ filename // 用egrep同樣可以實作

awk ‘/123|abc/’ filename // awk 的實作方式

與操作

grep pattern1 files | grep pattern2 :顯示既比對 pattern1 又比對 pattern2 的行。

10、-c 統計行數

grep -i “abc” test.txt|wc -l #不分大小寫。test.txt裡面包含abc過濾條件的為2行

2

grep -yc “abc” test.txt #-c呢,就是不顯示行的内容,直接顯示有幾行

2

cat /etc/passwd|wc -l

55

grep -c “^.*$” /etc/passwd #那麼我們除了wc -l用來統一一個檔案有多少行以外,又多了一種統計檔案多少行的方法

55

11、 -m的使用

cat test2.txt #這是測試檔案

abc 1

abc 2

abc 3

abc 4

abc 5

grep -m 3 “abc” test2.txt #隻比對到了第三行就退出了

abc 1

abc 2

abc 3

二、與正規表達式結合

複制代碼

grep的規則表達式:

\ 反義字元:如"""“表示比對”"

[ - ] 比對一個範圍,[0-9a-zA-Z]比對所有數字和字母

  • 所有字元,長度可為0
  • 前面的字元出現了一次或者多次

    ^ #比對行的開始 如:’^grep’比對所有以grep開頭的行。

    $ #比對行的結束 如:'grep$'比對所有以grep結尾的行。

    . #比對一個非換行符的字元 如:'gr.p’比對gr後接一個任意字元,然後是p。

  • #比對零個或多個先前字元 如:‘grep’比對所有一個或多個空格後緊跟grep的行。

    . #一起用代表任意字元。

    [] #比對一個指定範圍内的字元,如’[Gg]rep’比對Grep和grep。

    [^] #比對一個不在指定範圍内的字元,如:’[^A-FH-Z]rep’比對不包含A-R和T-Z的一個字母開頭,緊跟rep的行。

    (…) #标記比對字元,如’(love)’,love被标記為1。

    < #到比對正規表達式的行開始,如:’<grep’比對包含以grep開頭的單詞的行。

    > #到比對正規表達式的行結束,如’grep>'比對包含以grep結尾的單詞的行。

    x{m} #重複字元x,m次,如:'0{5}'比對包含5個o的行。

    x{m,} #重複字元x,至少m次,如:'o{5,}'比對至少有5個o的行。

    x{m,n} #重複字元x,至少m次,不多于n次,如:'o{5,10}'比對5–10個o的行。

    \w #比對文字和數字字元,也就是[A-Za-z0-9],如:'G\w*p’比對以G後跟零個或多個文字或數字字元,然後是p。

    \W #\w的反置形式,比對一個或多個非單詞字元,如點号句号等。

    \b #單詞鎖定符,如: '\bgrep\b’隻比對grep。

POSIX字元:

為了在不同國家的字元編碼中保持一至,POSIX(The Portable Operating System Interface)增加了特殊的字元類,如[:alnum:]是[A-Za-z0-9]的另一個寫法。要把它們放到[]号内才能成為正規表達式,如[A- Za-z0-9]或[[:alnum:]]。在linux下的grep除fgrep外,都支援POSIX的字元類。

[:alnum:] #文字數字字元

[:alpha:] #文字字元

[:digit:] #數字字元

[:graph:] #非空字元(非空格、控制字元)

[:lower:] #小寫字元

[:cntrl:] #控制字元

[:print:] #非空字元(包括空格)

[:punct:] #标點符号

[:space:] #所有空白字元(新行,空格,制表符)

[:upper:] #大寫字元

[:xdigit:] #十六進制數字(0-9,a-f,A-F)

複制代碼

例:通過管道過濾ls -l輸出的内容,隻顯示以a開頭的行。

首與行尾位元組 ^ $,^ 符号,在字元類符号(括号[])之内與之外是不同的! 在 [] 内代表『反向選擇』,在 [] 之外則代表定位在行首的意義!

$ ls -l | grep ‘^a’

$ ls -l | grep ^a

$ ls -l | grep [a] #輸出非a開頭的行,反向選擇

$ grep -n '^KaTeX parse error: Expected 'EOF', got '#' at position 20: …press.txt #̲找出空白行,因為隻有行首跟行尾…)

例:顯示所有以d開頭的檔案中包含test的行。

$ grep ‘test’ d*

例:輸出以hat結尾的行内容

$ cat test.txt |grep hat$

例:顯示在aa,bb,cc檔案中比對test的行。

$ grep ‘test’ aa bb cc

例:顯示所有包含每個字元串至少有5個連續小寫字元的字元串的行。

在一組集合位元組中,如果該位元組組是連續的,例如大寫英文/小寫英文/數字等等,就可以使用[a-z],[A-Z],[0-9]等方式來書寫,那麼如果我們的要求字串是數字與英文呢?就将他全部寫在一起,變成:[a-zA-Z0-9]。

$ grep ‘[a-z]{5}’ aa

$ grep -n ‘[0-9]’ regular_express.txt   #取得有數字的那一行

$ grep -n ‘3’ regular_express.txt    #隻輸出開頭是小寫字母的那一行

$ grep -n ‘[a-zA-Z]’ regular_express.txt #不輸出開頭是英文的

$ grep -n ‘.$’ regular_express.txt      #隻輸出行尾結束為小數點 (.) 的那一行

注意:小數點具有其他意義,是以必須要使用轉義字元()來加以解除其特殊意義!

例:顯示包含ed或者at字元的内容行

指令:cat test.txt |grep -E “ed|at”

例:如果west被比對,則es就被存儲到記憶體中,并标記為1,然後搜尋任意個字元(.*),這些字元後面緊跟着另外一個es(1),找到就顯示該行。如果用egrep或grep -E,就不用""号進行轉義,直接寫成’w(es)t.*1’就可以了。

$ grep ‘w(es)t.*1’ aa

例:顯示目前目錄下面以.txt 結尾的檔案中的所有包含每個字元串至少有7個連續小寫字元的字元串的行

指令:grep ‘[a-z]{7}’ *.txt

例:查詢IP位址、郵箱、手機号

這裡用到了-o和-P指令

man grep檢視

-o, --only-matching:

Show only the part of a matching line that matches PATTERN.

-P, --perl-regexp:

Interpret PATTERN as a Perl regular expression.

也就是說-o,隻顯示比對行中比對正規表達式的那部分,-P,作為Perl正則比對

192.168.0.1

[email protected]

比對ABC類IP位址即 1.0.0.1—223.255.255.254

指令(IP):grep -oP “([0-9]{1,3}.){3}[0-9]{1,3}” file.txt

或grep -E --color “<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-1][0-9]|22[0-3]).([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5]).([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5]).([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-4])>” file.txt

郵箱是任意長度數字字母@任意長度數字字母

指令(郵箱):grep -oP “[a-zA-Z0-9_-][email protected][a-zA-Z0-9_-]+(.[a-zA-Z0-9_-]+)+” file.txt

手機号碼是1[3|4|5|8]後面接9位數字的

指令(手機号):grep -E “<1[3|4|5|8][0-9]{9}>” file.txt

例:任意一個位元組 . 與重複位元組 *

. (小數點):代表『一定有一個任意位元組』的意思;

  • (星号):代表『重複前一個字元, 0 到無窮多次』的意思,為組合形态

    $ grep -n ‘[0-9][0-9]*’ regular_express.txt #找出『任意數字』的行

$ grep -n ‘g.*g’ regular_express.txt #找出以g行首與行尾的行,當中的字元可有可無

這個 .* 的 RE 表示任意字元是很常見的.

例:限定連續 RE 字元範圍 {}

利用 . 與 RE 字元及 * 來配置 0 個到無限多個重複位元組

打算找出兩個到五個 o 的連續字串,該如何作?這時候就得要使用到限定範圍的字元 {} 了。 但因為 { 與 } 的符号在 shell 是有特殊意義的,是以, 我們必須要使用字元 \ 來讓他失去特殊意義才行。

$ grep -n ‘o{2}’ regular_express.txt

$ grep -n ‘go{2,5}g’ regular_express.txt #要找出 g 後面接 2 到 5 個 o ,然後再接一個 g 的字串

$ grep -n ‘go{2,}g’ regular_express.txt #想要的是 2 個 o 以上的 goooo…g 呢?除了可以是 gooo*g

  1. 0-9 ↩︎
  2. 124ab ↩︎
  3. a-z ↩︎

繼續閱讀