天天看點

Linux指令:文本處理

    1. cut:切割指令

格式:cut

OPTION... [FILE]…

   -d, --delimiter CHAR:以指定的字元為分隔符,預設為空格

   -f, --fields:指定要顯示的字段

#:指定的單個字段;

#-#:連續的多個字段;

#,#:離散的多個字段;

-f1,3(表示1和3兩個字段)

-f1-3(表示1到3三個字段)

2. sort:文本排序

格式:sort

[OPTION]... [FILE]…

    -n, --numeric:基于數值大小而非字元進行排序;

   -r, --reverse:降序排序

   -t,

--field-separator:指定字段分隔符

   -k, --key #:以某字段為關鍵字進行排序

   -u, --unique:相同的僅顯示一次

   -f, --ignore-case:忽略字元大小寫

注意:

1)ASCII碼表中的升序排序

2)預設不是比較數字大小

3)逐個字元的ASCII碼大小比較排序

3. uniq:報告或移除重複的行(report or omit

repeated lines)

 -d: 隻顯示重複的行

           -c:顯示檔案中行重複的次數

           -u:僅顯示未曾重複過的行;

4. wc:文本統計,統計行,位元組數,詞數

-l:行數

-L:最大行長度

-w:詞數

-c:位元組數

5. tr:translate or delete characters ,翻譯或删除字元,不會對源檔案進行操作

把輸入的資料當中的字元,凡是在SET1定義範圍内出現的,通通對位轉換為SET2出現的字元

 格式:tr [OPTION]... SET1 [SET2]

1) tr  SET1  SET2  <  /PATH/FROM/SOMEFILE

2) tr  -d  SET1  <  /PATH/FROM/SOMEFILE

注意:該指令不修改原檔案

    6. tee:read from standard input and write to standard output and files

通常和管道一起使用,實作資料的分發處理,儲存并顯示在螢幕

格式:COMMAND | tee  /PATH/TO/SOMEFILE

7.diff:compare

files line by line,逐行比對檔案

        格式:diff [OPTION]... FILES

diff  /PATH/TO/OLDFILE  /PATH/TO/NEWFILE > /PATH/TO/PATCH_FILE

-u:使用unfied機制,即顯示要修改的行的上下文,預設為3行;

8.patch:向檔案打更新檔

繼續閱讀