天天看點

linux 下的文本處理之字元串替換——tr指令1、字元範圍2、使用tr指令“統一”字母大小寫3、把檔案中的數字0-9替換為a-j4、删除檔案file中出現的"Snail"字元5、删除檔案file中出現的換行'\n'、制表'\t'字元6、删除“連續着的”重複字母,隻保留第一個7、删除空行  8、删除Windows檔案“造成”的'^M'字元9、用空格符\040替換制表符\01110、把路徑變量中的冒号":",替換成換行符"\n"

通過使用 tr,您可以非常容易地實作 sed 的許多最基本功能。您可以将 tr 看作為 sed 的(極其)簡化的變體:它可以用一個字元來替換另一個字元,或者可以完全除去一些字元。您也可以用它來除去重複字元。這就是所有 tr 所能夠做的。 

    tr用來從标準輸入中通過替換或删除操作進行字元轉換。tr主要用于删除檔案中控制字元或進行字元轉換。使用tr時要轉換兩個字元串:字元串1用于查詢,字元串2用于處理各種轉換。tr剛執行時,字元串1中的字元被映射到字元串2中的字元,然後轉換操作開始。

    帶有最常用選項的tr指令格式為:

tr -c -d -s ["string1_to_translate_from"] ["string2_to_translate_to"] < input-file

這裡:

-c 用字元串1中字元集的補集替換此字元集,要求字元集為ASCII。

-d 删除字元串1中所有輸入字元。

-s 删除所有重複出現字元序列,隻保留第一個;即将重複出現字元串壓縮為一個字元串。

input-file是轉換檔案名。雖然可以使用其他格式輸入,但這種格式最常用。

1、字元範圍

指定字元串1或字元串2的内容時,隻能使用單字元或字元串範圍或清單。

[a-z] a-z内的字元組成的字元串。

[A-Z] A-Z内的字元組成的字元串。

[0-9] 數字串。

\octal 一個三位的八進制數,對應有效的ASCII字元。

[O*n] 表示字元O重複出現指定次數n。是以[O*2]比對OO的字元串。

tr中特定控制字元的不同表達方式

速記符含義八進制方式

\a Ctrl-G  鈴聲\007

\b Ctrl-H  倒退符\010

\f Ctrl-L  走行換頁\014

\n Ctrl-J  新行\012

\r Ctrl-M  回車\015

\t Ctrl-I  tab鍵\011

\v Ctrl-X  \030

執行個體:

、将檔案file中出現的"abc"替換為"xyz"

  # cat file | tr "abc" "xyz" > new_file   【注意】這裡,凡是在file中出現的"a"字母,都替換成"x"字母,"b"字母替換為"y"字母,"c"字母替換為"z"字母。而不是将字元串"abc"替換為字元串"xyz"。  

2、使用tr指令“統一”字母大小寫

(小寫 --> 大寫)

# cat file | tr [a-z] [A-Z] > new_file (大寫 --> 小寫)

# cat file | tr [A-Z] [a-z] > new_file  

3、把檔案中的數字0-9替換為a-j

  # cat file | tr [0-9] [a-j] > new_file

4、删除檔案file中出現的"Snail"字元

  # cat file | tr -d "Snail" > new_file   【注意】這裡,凡是在file檔案中出現的'S','n','a','i','l'字元都會被删除!而不是緊緊删除出現的"Snail”字元串。  

5、删除檔案file中出現的換行'\n'、制表'\t'字元

  # cat file | tr -d "\n\t" > new_file   不可見字元都得用轉義字元來表示的,這個都是統一的。

6、删除“連續着的”重複字母,隻保留第一個

  # cat file | tr -s [a-zA-Z] > new_file

7、删除空行

  # cat file | tr -s "\n" > new_file

8、删除Windows檔案“造成”的'^M'字元

  # cat file | tr -d "\r" > new_file

或者

# cat file | tr -s "\r" "\n" > new_file   【注意】這裡-s後面是兩個參數"\r"和"\n",用後者替換前者

9、用空格符\040替換制表符\011

  # cat file | tr -s "\011" "\040" > new_file  

10、把路徑變量中的冒号":",替換成換行符"\n"

  # echo $PATH | tr -s ":" "\n"

本文來源:http://blog.csdn.net/trochiluses/article/details/10110551

繼續閱讀