天天看點

awk 以列為域提取檔案内容

檔案内容如下:

<code>[root@hxy tmp]</code><code># cat file</code>

<code>[aa]</code>

<code>aa1</code>

<code>dd2</code>

<code>dd3</code>

<code>dd4</code>

<code>[bb]</code>

<code>dd5</code>

<code>dd6</code>

<code>dd7</code>

<code>xx8</code>

<code>dd9</code>

<code>[cc]</code>

<code>ee2</code>

<code>334</code>

<code>ghdfg7</code>

<code>uuu</code>

<code>ooo7</code>

<code>sdsd</code>

<code>ggg</code>

<code>gogo</code>

<code>pp[</code>

<code>gggs</code>

<code>ssss</code>

<code>jjjj</code>

<code>aaaa</code>

我現在的需求是提取出[bb] 到[cc]之間的所有行

<code>[root@hxy tmp]</code><code># awk -v RS= '/^\[bb]/' file</code>

這個怎麼了解呢?

-v 大家度知道是指定變量的

是以這個-v一是同樣的指定了RS=

等于空就是預設的輸入分隔符為'\n'既是空行

so我們這裡的檔案就會被分為3行了

<code>[root@hxy tmp]</code><code># awk -v RS= '{print $1,$2,$3,$4,$5,$6,$7}' file</code>

<code>[aa] aa1 dd2 dd3 dd4</code>

<code>[bb] dd5 dd6 dd7 xx8 dd9</code>

<code>[cc] ee2 334 ghdfg7 uuu ooo7 sdsd</code>

這樣是不是好了解多了,我想列印哪一行就列印哪一行就行了

<code>[root@hxy tmp]</code><code># awk -v RS= 'NR==2 {print}' file</code>

這裡的 NR==2 {print} 和 /^\[aa]/ 是同樣的結果

第一個是明确了列印第二行

第二個是比對[aa]然後列印[aa]所在的行,達到同樣的結果

<code>[root@hxy tmp]</code><code># awk -v RS= 'NR==2,NR==3 {print}' file</code>

這樣列印出來的是第二個域到第三個域之間的結果

<code>[root@hxy tmp]</code><code># awk -v RS= 'NR==1,NR==3 {print}' file</code>

而這樣列印的是第一個域到第三個域之間的結果

如果我隻想列印第一域和第三域呢?

[root@hxy tmp]# awk -v RS= 'NR==1;NR==3 {print}' file

[aa]

aa1

dd2

dd3

dd4

[cc]

ee2

334

ghdfg7

uuu

ooo7

sdsd

ggg

gogo

pp[

gggs

ssss

jjjj

aaaa

這樣就行了.

如果有其他的要求,在幹要求改就行了到此實驗結束.

本文轉自  Forande  51CTO部落格,原文連結:http://blog.51cto.com/853056088/1932477