天天看點

tr指令檔案過濾分割與合并詳解

tr指令檔案過濾分割與合并

tr指令可以對來自标準輸入的字元進行替換、壓縮和删除。它可以将一組字元變成另一組字元,經常用來編寫優美的單行指令,作用很強大。

文法

tr(選項)(參數)

選項

-c或——complerment:取代所有不屬于第一字元集的字元;
-d或——delete:删除所有屬于第一字元集的字元;
-s或--squeeze-repeats:把連續重複的字元以單獨一個字元表示;
-t或--truncate-set1:先删除第一字元集較第二字元集多出的字元。      

參數

字元集1:指定要轉換或删除的原字元集。當執行轉換操作時,必須使用參數“字元集2”指定轉換的目标字元集。但執行删除操作時,不需要參數“字元集2”;

字元集2:指定要轉換成的目标字元集。

執行個體

将輸入字元由大寫轉換為小寫:

echo "HELLO WORLD" | tr 'A-Z' 'a-z'
hello world      

‘A-Z’ 和 ‘a-z’都是集合,集合是可以自己制定的,例如:‘ABD-}’、‘bB.,’、‘a-de-h’、‘a-c0-9’都屬于集合,集合裡可以使用’\n’、’\t’,可以可以使用其他ASCII字元。

使用tr删除字元:

echo "hello 123 world 456" | tr -d '0-9'
hello  world      

将制表符轉換為空格:

cat text | tr '\t' ' '      

字元集補集,從輸入文本中将不在補集中的所有字元删除:

echo aa.,a 1 b#$bb 2 c*/cc 3 ddd 4 | tr -d -c '0-9 \n'
 1  2  3  4      

此例中,補集中包含了數字0~9、空格和換行符\n,是以沒有被删除,其他字元全部被删除了。

用tr壓縮字元,可以壓縮輸入中重複的字元:

echo "thissss is      a text linnnnnnne." | tr -s ' sn'
this is a text line.      

巧妙使用tr做數字相加操作:

echo 1 2 3 4 5 6 7 8 9 | xargs -n1 | echo $[ $(tr '\n' '+') 0 ]      

删除Windows檔案“造成”的’^M’字元:

cat file | tr -s "\r" "\n" > new_file
或
cat file | tr -d "\r" > new_file      
[:alnum:]:字母和數字
[:alpha:]:字母
[:cntrl:]:控制(非列印)字元
[:digit:]:數字
[:graph:]:圖形字元
[:lower:]:小寫字母
[:print:]:可列印字元
[:punct:]:标點符号
[:space:]:空白字元
[:upper:]:大寫字母
[:xdigit:]:十六進制字元      
tr '[:lower:]' '[:upper:]'      

繼續閱讀