天天看点

Linux命令:文本处理

    1. cut:切割命令

格式:cut

OPTION... [FILE]…

   -d, --delimiter CHAR:以指定的字符为分隔符,默认为空格

   -f, --fields:指定要显示的字段

#:指定的单个字段;

#-#:连续的多个字段;

#,#:离散的多个字段;

-f1,3(表示1和3两个字段)

-f1-3(表示1到3三个字段)

2. sort:文本排序

格式:sort

[OPTION]... [FILE]…

    -n, --numeric:基于数值大小而非字符进行排序;

   -r, --reverse:降序排序

   -t,

--field-separator:指定字段分隔符

   -k, --key #:以某字段为关键字进行排序

   -u, --unique:相同的仅显示一次

   -f, --ignore-case:忽略字符大小写

注意:

1)ASCII码表中的升序排序

2)默认不是比较数字大小

3)逐个字符的ASCII码大小比较排序

3. uniq:报告或移除重复的行(report or omit

repeated lines)

 -d: 只显示重复的行

           -c:显示文件中行重复的次数

           -u:仅显示未曾重复过的行;

4. wc:文本统计,统计行,字节数,词数

-l:行数

-L:最大行长度

-w:词数

-c:字节数

5. tr:translate or delete characters ,翻译或删除字符,不会对源文件进行操作

把输入的数据当中的字符,凡是在SET1定义范围内出现的,通通对位转换为SET2出现的字符

 格式:tr [OPTION]... SET1 [SET2]

1) tr  SET1  SET2  <  /PATH/FROM/SOMEFILE

2) tr  -d  SET1  <  /PATH/FROM/SOMEFILE

注意:该命令不修改原文件

    6. tee:read from standard input and write to standard output and files

通常和管道一起使用,实现数据的分发处理,保存并显示在屏幕

格式:COMMAND | tee  /PATH/TO/SOMEFILE

7.diff:compare

files line by line,逐行比对文件

        格式:diff [OPTION]... FILES

diff  /PATH/TO/OLDFILE  /PATH/TO/NEWFILE > /PATH/TO/PATCH_FILE

-u:使用unfied机制,即显示要修改的行的上下文,默认为3行;

8.patch:向文件打补丁

继续阅读