天天看點

linux 重複模式的元字元,詳解Sed指令的用法與正規表達式元字元

sed指令用法

sed是一種流編輯器,它是文本進行中非常有用的工具,能夠完美的配合正規表達式使用,功能不同凡響。處理時,把目前處理的行存儲在臨時緩沖區中,稱為『模式空間』(pattern space),接着用sed指令處理緩沖區中的内容,處理完成後,把緩沖區的内容送往螢幕。接着處理下一行,這樣不斷重複,直到檔案末尾。檔案内容并沒有改變,除非你使用重定向存儲輸出。sed主要用來自動編輯一個或多個檔案,簡化對檔案的反複操作,編寫轉換程式等。

1.簡介

sed是非互動式的編輯器。它不會修改檔案,除非使用shell重定向來儲存結果。預設情況下,所有的輸出行都被列印到螢幕上。

sed編輯器逐行處理檔案(或輸入),并将結果發送到螢幕。具體過程如下:首先sed把目前正在處理的行儲存在一個臨時緩存區中(也稱為模式空間),然後處理臨時緩沖區中的行,完成後把該行發送到螢幕上。sed每處理完一行就将其從臨時緩沖區删除,然後将下一行讀入,進行

處理和顯示。處理完輸入檔案的最後一行後,sed便結束運作。sed把每一行都存在臨時緩沖區中,對這個副本進行編輯,是以不會修改原檔案。

2.定址

定址用于決定對哪些行進行編輯。位址的形式可以是數字、正規表達式、或二者的結合。如果沒有指定位址,sed将處理輸入檔案的所有行。

位址是一個數字,則表示行号;是“$"符号,則表示最後一行。例如:sed -n '$p' /etc/issue

3.指令與選項

sed指令告訴sed如何處理由位址指定的各輸入行,如果沒有指定位址則處理所有的輸入行。

3.1 sed指令

a\

在目前行後添加一行或多行。多行時除最後一行外,每行末尾需用“\”續行    -a,隻是顯示,如果要真的更改文本,就要sed -i.bak ''   這樣就會出來一個帶bak格式的檔案,這個檔案是源檔案

[[email protected] app]#cat -n passwd.txt | sed '10,20a\       11 adadadadadada '

c\

用此符号後的新文本替換目前行中的文本。多行時除最後一行外,每行末尾需用"\"續行

cat -n passwd.txt | sed '10c\XXXXXXXXXXXXXXXXXX'

i\

在目前行之前插入文本。多行時除最後一行外,每行末尾需用"\"續行

cat -n passwd.txt | sed '10i\XXXXXXXXXXXXXXXXXX'

d

删除行  :ss -ntl |sed '1d'       删除第一行

h

把模式空間裡的内容複制到暫存緩沖區

H

把模式空間裡的内容追加到暫存緩沖區

g

把暫存緩沖區裡的内容複制到模式空間,覆寫原有的内容

G

把暫存緩沖區的内容追加到模式空間裡,追加在原有内容的後面

p

列印目前模式空間内容,追加到預設輸出之後

n

讀入下一輸入行,并從下一條指令而不是第一條指令開始對其的處理

q

結束或退出sed

r

從檔案中讀取輸入行

!

對所選行以外的所有行應用指令

s

用一個字元串替換另一個

g

在行内進行全局替換:cat -n passwd.txt | sed 's@/bin/bash$@ /sbin/[email protected]'

w

将所選的行寫入檔案:sed '/^lixiaozi/w /app/lixiaozi.txt' passwd.txt

x

交換暫存緩沖區與模式空間的内容

y

将字元替換為另一字元(不能對正規表達式使用y指令)

3.2 sed選項

選項

功能

-e

進行多項編輯,即對輸入行應用多條sed指令時使用

-n

取消預設的輸出

-f

指定sed腳本的檔案名

4.退出狀态

sed不向grep一樣,不管是否找到指定的模式,它的退出狀态都是0。隻有當指令存在文法錯誤時,sed的退出狀态才不是0。

5.正規表達式元字元

與grep一樣,sed也支援特殊元字元,來進行模式查找、替換。不同的是,sed使用的正規表達式是括在斜杠線"/"之間的模式。

如果要把正規表達式分隔符"/"改為另一個字元,比如o,隻要在這個字元前加一個反斜線,在字元後跟上正規表達式,再跟上這個字元即可。例如:sed -n '\o^Myop' datafile

元字元

功能

示例

^

行首定位符

/^my/   比對所有以my開頭的行

$

行尾定位符

/my$/   比對所有以my結尾的行

.

比對除換行符以外的單個字元

/m..y/   比對包含字母m,後跟兩個任意字元,再跟字母y的行

*

比對零個或多個前導字元

/my*/   比對包含字母m,後跟零個或多個y字母的行

[]

比對指定字元組内的任一字元

/[Mm]y/   比對包含My或my的行

[^]

比對不在指定字元組内的任一字元

/[^Mm]y/   比對包含y,但y之前的那個字元不是M或m的行

\(..\)

儲存已比對的字元

1,20s/\(you\)self/\1r/   标記元字元之間的模式,并将其儲存為标簽1,之後可以使用\1來引用它。最多可以定義9個标簽,從左邊開始編号,最左邊的是第一個。此例中,對第1到第20行進行處理,you被儲存為标簽1,如果發現youself,則替換為your。

&

儲存查找串以便在替換串中引用

s/my    符号&代表查找串。my将被替換為**my**

\<

詞首定位符

/\

\>

詞尾定位符

/my\>/   比對包含以my結尾的單詞的行

x\{m\}

連續m個x

/9\{5\}/ 比對包含連續5個9的行

x\{m,\}

至少m個x

/9\{5,\}/   比對包含至少連續5個9的行

x\{m,n\}

至少m個,但不超過n個x

/9\{5,7\}/   比對包含連續5到7個9的行

6.範例

6.1 p指令

指令p用于顯示模式空間的内容。預設情況下,sed把輸入行列印在螢幕上,選項-n用于取消預設的列印操作。當選項-n和指令p同時出現時,sed可列印標明的内容。

sed '/my/p' datafile

#預設情況下,sed把所有輸入行都列印在标準輸出上。如果某行比對模式my,p指令将把該行另外列印一遍。

[[email protected] ~]#sed -n '3p' filelist.txt

隻列印第三行

隻顯示指定行範圍的檔案内容,例如:

#  隻檢視檔案的第20行到第30行,并且帶上行号

cat -n /etc/passwd | sed  -n '20,30p'

6.2 d指令

指令d用于删除輸入行。sed先将輸入行從檔案複制到模式空間裡,然後對該行執行sed指令,最後将模式空間裡的内容顯示在螢幕上。如果發出的是指令d,目前模式空間裡的輸入行會被删除,不被顯示。

sed '$d' datafile

#删除最後一行,其餘的都被顯示

cat -n passwd.txt | sed '/mail/,25d'

#删除包含"mail"的行到第25行的内容

位址是逗号分隔的,那麼需要處理的位址是這兩行之間的範圍(包括這兩行在内)。範圍可以用數字、正規表達式、或二者的組合表示。例如:

sed '2,5d' datafile

#删除第二到第五行

sed '/My/,/You/d' datafile

#删除包含"My"的行到包含"You"的行之間的行

6.3 s指令

sed 's/^My/You/g' datafile

#指令末端的g表示在行内進行全局替換,也就是說如果某行出現多個My,所有的My都被替換為You。

6.4 e選項

-e是編輯指令,用于sed執行多個編輯任務的情況下。在下一行開始編輯前,所有的編輯動作将應用到模式緩沖區中的行上。

sed -e '1,10d' -e 's/My/Your/g' datafile

#選項-e用于進行多重編輯。第一重編輯删除第1-3行。第二重編輯将出現的所有My替換為Your。因為是逐行進行這兩項編輯(即這兩個指令都在模式空間的目前行上執行),是以編輯指令的順序會影響結果。

6.5 w指令

sed -n '/hrwang/w me.txt' datafile

6.6 a\ 指令

a\ 指令是追加指令,追加将添加新文本到檔案中目前行(即讀入模式緩沖區中的行)的後面。所追加的文本行位于sed指令的下方另起一行。如果要追加的内容超過一行,則每一行都必須以反斜線結束,最後一行除外。最後一行将以引号和檔案名結束。

sed '/^hrwang/a\

>hrwang and mjfan are husband\

>and wife' datafile

#如果在datafile檔案中發現比對以hrwang開頭的行,則在該行下面追加hrwang and mjfan are husband and wife

6.7 i\ 指令

i\ 指令是在目前行的前面插入新的文本。

6.8 c\ 指令

sed使用該指令将已有文本修改成新的文本。

6.9 n指令

sed使用該指令擷取輸入檔案的下一行,并将其讀入到模式緩沖區中,任何sed指令都将應用到比對行緊接着的下一行上。

sed '/hrwang/{n;s/My/Your/;}' datafile

總結

以上所述是小編給大家介紹的詳解Sed指令的用法與正規表達式元字元,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回複大家的。在此也非常感謝大家對腳本之家網站的支援!