天天看點

linux下shell程式設計常用grep\awk\sed文法

1. grep 常用方法與參數

grep "關鍵字" 檔案名

grep "關鍵字" 檔案名1 檔案名2 ..... //在指定的多個檔案中查找關鍵字

grep "關鍵字" * //表示在目前目錄下的所有檔案中查找

grep "關鍵字" * -R //表示在目前目錄下查找,如果有子目錄則進入到子目錄中查找

grep "正規表達式" * //在檔案中按正規表達式查找關鍵字

grep -n "關鍵字" * //顯示出關鍵字在檔案中的行号

grep -c "關鍵字" * //隻列印比對的行數,不顯示比對的内容。

grep -v "關鍵字" 檔案名//選擇那些不比對搜尋條件的行

grep -i "關鍵字" 檔案名 //忽略關鍵字的大小寫

grep -l "關鍵字" * //隻顯示查找到的檔案,不顯示關鍵字

用grep -v '^$' file 過濾空行

用grep -v '^[[:space:]]$' file 過濾空行

2. sed

(1)基本知識

sed -e '編輯指令1' -e '編輯指令2' ... 檔案檔 //基本格式

-e 表式後邊跟的是編輯指令

編輯指令由兩部分組成. [address1[,address2]]function[argument] 其中, 位址參數 address1 、address2 為行數或 regular expression 字元串 , 表示所執行編輯的資料行 ; 函數參數 function[argument] 為 sed 的内定函數 , 表示執行的編輯動作。

(2)sed選項

-n 不列印;s e d不寫編輯行到标準輸出,預設為列印所有行(編輯和未編輯)。p指令可以用來列印編輯行。

-f 如果正在調用s e d腳本檔案,使用此選項。此選項通知s e d一個腳本檔案支援所有的s e d指令,例如:sed -f myscript.sed input_file,這裡m y s c r i p t . s e d即為支援s e d指令的檔案。

-c 下一指令是編輯指令。使用多項編輯時加入此選項。如果隻用到一條s e d指令,此選項無用,但指定它也沒有關系。

-i 編輯原檔案(此選項慎用,如果使用則原檔案就會被修改,無法恢複)。

(3)位址

sed -e '10d' filename //删除檔内第 10 行資料 , 則指令為 10d。

sed -e '/man/d filename //删除含有 "man" 字元串的資料行時 , 則指令為 /man/d。

sed -e '1,3d' //删除檔内第 1 行到第 3 行資料, 則指令為 1,3d。

sed -e '1,/man/d' filename //删除檔内第 1 行到含 "man" 字元串的資料行

sed -e '/man/, 3d' filename //删除檔内含 "man"行到第 3 的資料行

sed -e '/man1/,/man2/d' filename //删除檔内第含"man1"行到含“man2" 的資料行

(4)編輯指令

p 列印比對行

= 顯示檔案行号

a\ 在定位行号後附加新文本資訊

i\ 在定位行号後插入新文本資訊

d 删除定位行

c\ 用新文本替換定位文本

s 使用替換模式替換相應模式

r 從另一個檔案中讀文本

w 寫文本到一個檔案

q 第一個模式比對完成後推出或立即推出

l 顯示與八進制A S C I I代碼等價的控制字元

{ } 在定位行執行的指令組

n 從另一個檔案中讀文本下一行,并附加在下一行

g 将模式2粘貼到/pattern n/

y 傳送字元

n 延續到下一輸入行;允許跨行的模式比對語句

sed -e '/machine/s/phi/beta/g' filename //在filename中搜尋包含machine的行,然後用beta替換phi。

sed -e '5c\ 

Those must often wipe a bloody nose. 

' filename 

//将第5行替換為 Those must often wipe a bloody nose. ,其中c後邊的"\"是連字元。

sed -e '1,100c\ 

How are you?\ 

data be deleted! 

' filename

//将檔案中 1 至 100 行的資料區 , 替換成輸入的兩行。

sed -e '/man/w filename2' filename1 //搜尋man所在行,寫到 filename2中

sed -e '/man/r filename2' filename1 //将filename2中的内容讀到man所在行

sed -i "s/查找的關鍵字/替換的詞/g" 檔案名将檔案名中所有關鍵字替換成指定字元串

3. awk

awk 用法:awk ‘ pattern {action} ‘

變量名含義

ARGC 指令行變元個數

ARGV 指令行變元數組

FILENAME 目前輸入檔案名

FNR 目前檔案中的記錄号

FS 輸入域分隔符,預設為一個空格

RS 輸入記錄分隔符

NF 目前記錄裡域個數

NR 到目前為止記錄數

OFS 輸出域分隔符

ORS 輸出記錄分隔符

1、

awk ‘/101/’ file 顯示檔案file中包含101的比對行。

awk ‘/101/,/105/’ file

awk ‘$1 == 5′ file

awk ‘$1 == “CT”‘ file 注意必須帶雙引号

awk ‘$1 * $2 >100 ‘ file

awk ‘$2 >5 && $2<=15' file

2、

awk '{print NR,NF,$1,$NF,}' file 顯示檔案file的目前記錄号、域數和每一行的第一個和最後一個域。

awk '/101/ {print $1,$2 + 10}' file 顯示檔案file的比對行的第一、二個域加10。

awk '/101/ {print $1$2}' file

awk '/101/ {print $1 $2}' file 顯示檔案file的比對行的第一、二個域,但顯示時域中間沒有分隔符。

3、

df | awk '$4>1000000 ‘ 通過管道符獲得輸入,如:顯示第4個域滿足條件的行。

4、

awk -F “|” ‘{print $1}’ file 按照新的分隔符”|”進行操作。

awk ‘BEGIN { FS=“[: \t|]” } {print $1,$2,$3}’ file 通過設定輸入分隔符(FS=“[: \t|]”)修改輸入分隔符。

Sep=“|”

awk -F $Sep ‘{print $1}’ file 按照環境變量Sep的值做為分隔符。

awk -F ‘[ :\t|]’ ‘{print $1}’ file 按照正規表達式的值做為分隔符,這裡代表空格、:、TAB、|同時做為分隔符。

awk -F ‘[][]’ ‘{print $1}’ file 按照正規表達式的值做為分隔符,這裡代表[、]

5、

awk -f awkfile file 通過檔案awkfile的内容依次進行控制。

cat awkfile /101/{print “\047 Hello! \047″} –遇到比對行以後列印‘ Hello! ‘.\047代表單引号。

{print $1,$2} –因為沒有模式控制,列印每一行的前兩個域。

6、

awk ‘$1 ~ /101/ {print $1}’ file 顯示檔案中第一個域比對101的行(記錄)。

7、

awk ‘BEGIN { OFS=“%”} {print $1,$2}’ file 通過設定輸出分隔符(OFS=“%”)修改輸出格式。

8、

awk ‘BEGIN { max=100 ;print “max=“ max} BEGIN 表示在處理任意行之前進行的操作。{max=($1 > max ?$1:max); print $1,”Now max is “max}’ file 取得檔案第一個域的最大值。

(表達式1?表達式2:表達式3 相當于:

if (表達式1)

表達式2

else

表達式3

awk ‘{print ($1>4 ? “high “$1: “low “$1)}’ file

9、

awk ‘$1 * $2 >100 {print $1}’ file 顯示檔案中第一個域比對101的行(記錄)。

10、

awk ‘{$1 == ‘Chi’ {$3 = ‘China’; print}’ file 找到比對行後先将第3個域替換後再顯示該行(記錄)。

awk ‘{$7 %= 3; print $7}’ file 将第7域被3除,并将餘數賦給第7域再列印。

11、

awk ‘/tom/ {wage=$2+$3; printf wage}’ file 找到比對行後為變量wage指派并列印該變量。

12、

awk ‘/tom/ {count++;}

END {print “tom was found “count” times”}’ file END表示在所有輸入行處理完後進行處理。

13、

awk ‘gsub(/\$/,”");gsub(/,/,”"); cost+=$4; END {print “The total is $” cost>“filename”}’ file gsub函數用空串替換$和,再将結果輸出到filename中。

1 2 3 $1,200.00

1 2 3 $2,300.00

1 2 3 $4,000.00

awk ‘{gsub(/\$/,”");gsub(/,/,”");

if ($4>1000&&$4<2000) c1+=$4;

else if ($4>2000&&$4<3000) c2+=$4;

else if ($4>3000&&$4<4000) c3+=$4;

else c4+=$4; }

END {printf "c1=[%d];c2=[%d];c3=[%d];c4=[%d]\n",c1,c2,c3,c4}"' file

通過if和else if完成條件語句

awk '{gsub(/\$/,"");gsub(/,/,"");

if ($4>3000&&$4<4000) exit;

通過exit在某條件時退出,但是仍執行END操作。

if ($4>3000) next;

END {printf “c4=[%d]\n”,c4}”‘ file

通過next在某條件時跳過該行,對下一行執行操作。

14、

awk ‘{ print FILENAME,$0 }’ file1 file2 file3>fileall 把file1、file2、file3的檔案内容全部寫到fileall中,格式為列印檔案并前置檔案名。

15、

awk ‘ $1!=previous { close(previous); previous=$1 }

{print substr($0,index($0,” “) +1)>$1}’ fileall 把合并後的檔案重新分拆為3個檔案。并與原檔案一緻。

16、

awk ‘BEGIN {“date”|getline d; print d}’ 通過管道把date的執行結果送給getline,并賦給變量d,然後列印。

17、

awk ‘BEGIN {system(“echo \”Input your name:\\c\”"); getline d;print “\nYour name is”,d,”\b!\n”}’

通過getline指令互動輸入name,并顯示出來。

awk ‘BEGIN {FS=“:”; while(getline< "/etc/passwd" >0) { if($1~”050[0-9]_”) print $1}}’

列印/etc/passwd檔案中使用者名包含050x_的使用者名。

18、

awk '{ i=1;while(i<NF) {print NF,$i;i++}}' /etc/passwd

19、

在awk中調用系統變量必須用單引号,如果是雙引号,則表示字元串

Flag=abcd

awk ‘{print ‘$Flag’}’ 結果為abcd

awk ‘{print “$Flag”}’ 結果為$Flag

本文轉自 jxwpx 51CTO部落格,原文連結:http://blog.51cto.com/jxwpx/1242976,如需轉載請自行聯系原作者

繼續閱讀