天天看點

[Shell]tr指令詳解

版權聲明:本文為部落客原創文章,未經部落客允許不得轉載。 https://blog.csdn.net/SunnyYoona/article/details/52986893

1. 用途

tr,translate的簡寫,主要用于壓縮重複字元,删除檔案中的控制字元以及進行字元轉換操作。

2. 文法
  1. tr [OPTION]... SET1 [SET2]

3. 參數

3.1 -s 壓縮重複字元

-s: squeeze-repeats,用SET1指定的字元來替換對應的重複字元 (replace each input sequence of  a  repeated  character  that  is listed in SET1 with a single occurrence of that character)

  1. xiaosi@Qunar:~/test$ echo "aaabbbaacccfddd" | tr -s [abcdf] // abacfd

可以使用這一特點,删除檔案中的空白行,實質上跟上面一樣,都是用SET1指定的字元來替換對應的重複字元

  1. xiaosi@Qunar:~/test$ cat b.txt

  2. I like football

  3. Football is very fun!

  4. Hello

  5. xiaosi@Qunar:~/test$ cat b.txt | tr -s ["\n"]

  6. I like football

  7. Football is very fun!

  8. Hello

3.2 -d 删除字元

-d:delete,删除SET1中指定的所有字元,不轉換(delete characters in SET1, do not translate)

  1. xiaosi@Qunar:~/test$ echo "a12HJ13fdaADff" | tr -d "[a-z][A-Z]"

  2. 1213

  3. xiaosi@Qunar:~/test$ echo "a1213fdasf" | tr -d [adfs]

  4. 1213

3.3 字元替換

-t:truncate,将SET1中字元用SET2對應位置的字元進行替換,一般預設為-t

  1. xiaosi@Qunar:~/test$ echo "a1213fdasf" | tr -t [afd] [AFO] // A1213FOAsF

上述代碼将a轉換為A,f轉換為F,d轉換為O。

可以利用這一特點,實作大小字母的轉換

  1. xiaosi@Qunar:~/test$ echo "Hello World I Love You" |tr -t [a-z] [A-Z]

  2. HELLO WORLD I LOVE YOU

  3. xiaosi@Qunar:~/test$ echo "HELLO WORLD I LOVE YOU" |tr -t [A-Z] [a-z]

  4. hello world i love you

也可以利用字元集合進行轉換

  1. xiaosi@Qunar:~/test$ echo "Hello World I Love You" |tr -t [:lower:] [:upper:]

  2. HELLO WORLD I LOVE YOU

  3. xiaosi@Qunar:~/test$ echo "HELLO WORLD I LOVE YOU" |tr -t [:upper:] [:lower:]

  4. hello world i love you

備注:

字元集合如下

  1. \NNN 八進制值的字元 NNN (1 to 3 為八進制值的字元)

  2. \\ 反斜杠

  3. \a Ctrl-G 鈴聲

  4. \b Ctrl-H 倒退符

  5. \f Ctrl-L 走行換頁

  6. \n Ctrl-J 新行

  7. \r Ctrl-M 回車

  8. \t Ctrl-I tab鍵

  9. \v Ctrl-X 水準制表符

  10. CHAR1-CHAR2 從CHAR1 到 CHAR2的所有字元按照ASCII字元的順序

  11. [CHAR*] in SET2, copies of CHAR until length of SET1

  12. [CHAR*REPEAT] REPEAT copies of CHAR, REPEAT octal if starting with 0

  13. [:alnum:] 所有的字母和數字

  14. [:alpha:] 所有字母

  15. [:blank:] 水準制表符,空白等

  16. [:cntrl:] 所有控制字元

  17. [:digit:] 所有的數字

  18. [:graph:] 所有可列印字元,不包括空格

  19. [:lower:] 所有的小寫字元

  20. [:print:] 所有可列印字元,包括空格

  21. [:punct:] 所有的标點字元

  22. [:space:] 所有的橫向或縱向的空白

  23. [:upper:] 所有大寫字母

3.4 字元補集替換

-c:complement,用SET2替換SET1中沒有包含的字元

  1. xiaosi@Qunar:~/test$ cat a.txt

  2. Monday 09:00

  3. Tuesday 09:10

  4. Wednesday 10:11

  5. Thursday 11:30

  6. Friday 08:00

  7. Saturday 07:40

  8. Sunday 10:00

  9. xiaosi@Qunar:~/test$ cat a.txt | tr -c "[a-z][A-Z]" "#" | tr -s "#" | tr -t "#" "\n"

  10. Monday

  11. Tuesday

  12. Wednesday

  13. Thursday

  14. Friday

  15. Saturday

  16. Sunday

上面代碼中 tr -c "[a-z][A-Z]" "#" 表示将除大小字母以外的所有的字元都替換為#。

上面代碼可優化為:

  1. xiaosi@Qunar:~/test$ cat a.txt | tr -cs "[a-z][A-Z]" "\n"

  2. Monday

  3. Tuesday

  4. Wednesday

  5. Thursday

  6. Friday

  7. Saturday

  8. Sunday



上一篇: [Hive]Hive安裝