【一天一个shell命令】文本内容操作系列-cut

2017-11-07 23:50:00

说明：

cut 按列切分文件，你可以指定分隔每列的定界符。在cut的术语中，每列都是一个字段，就是有时候说第一列，可能表述称第一个字段。

实战：

假设有文件data.txt,格式如下

NO Name Mark Percent

1 Sarath 45 90

2 Alex 49 98

3 Anu 45 90

分隔符（定界符）为Tab 制表符

如果我要取得第二列，所有人的名称，有什么好的办法吗？此时cut该大显身手了。

1. 取得2,3列即name,和mark

$cut –f 2,3 data.txt

2. 取得除第3列以外所有列

$cut –f3 –complement data.txt

3. 采取其他定界符，可以用-d改变。

假设data_comma.txt：

NO,Name,Mark,Percent

1,Sarath,45,90

2,Alex,49,98

3,Anu,45,90

则：

$cut –f2 -d"," data_comma.txt

解读—help

用法：cut [选项]... [文件]...

从每个文件中输出指定部分到标准输出。

长选项必须使用的参数对于短选项时也是必需使用的。

-b, --bytes=列表只选中指定的这些字节

-c, --characters=列表只选中指定的这些字符

-d, --delimiter=分界符使用指定分界符代替制表符作为区域分界

-f, --fields=列表只选中指定的这些域；并打印所有不包含分界符的

行，除非-s 选项被指定

-n (忽略)

--complement 补全选中的字节、字符或域

-s, --only-delimited 不打印没有包含分界符的行

--output-delimiter=字符串使用指定的字符串作为输出分界符，默认采用输入

的分界符

--help 显示此帮助信息并退出

--version 显示版本信息并退出

仅使用f -b, -c 或-f 中的一个。每一个列表都是专门为一个类别作出的，或者您可以用逗号隔

开要同时显示的不同类别。您的输入顺序将作为读取顺序，每个仅能输入一次。

每种参数格式表示范围如下：

N 从第1 个开始数的第N 个字节、字符或域

N- 从第N 个开始到所在行结束的所有字符、字节或域

N-M 从第N 个开始到第M 个之间(包括第M 个)的所有字符、字节或域

-M 从第1 个开始到第M 个之间(包括第M 个)的所有字符、字节或域

当没有文件参数，或者文件不存在时，从标准输入读取

解读：

1.取得某一列的字符或者字节可以用-c， -b等

2.可以取得某个范围

1和2综合例子：

有文件range_data.txt，内容如下

abcdefghijklmnopqrstuvwxyz

运行：$cut range_data.txt -c-2

打印字符1-2列

再复杂一点：

$cut range_data.txt -c1-3,6-9 --output-delimiter ","

打印1-3行，6-9行，并且用逗号分隔。

命令比较简单，主要还是借鉴书籍《linux shell脚本攻略》,从附件中会看到一排格式很差的字母，尝试用-s过滤掉他。

本文转自 wws5201985 51CTO博客，原文链接：http://blog.51cto.com/yjplxq/960585，如需转载请自行联系原作者

【一天一个shell命令】文本内容操作系列-cut

继续阅读

1、Linux 命令行使用技巧

VBA调用cmd命令行下执行的命令

在当前位置打开命令行窗口的技巧

unit 1 - redhat Enterprise 8.0 Linux 命令行使用技巧

Windows命令行中使用SSH连接Linux

Linux下命令行中的复制和粘贴

1.Linux命令行使用技巧

spec文件详解

HK-2000数据采集仪数据库操作说明

终端环境之tmux

查找文件中的字符串

拒绝用户登录:/bin/false和/usr/sbin/nologin

Shell编程——sort排序、uniq忽略重复、tr替换压缩删除、cut指定删除字段、正则表达式元字符sort 命令uniq 命令tr 命令cut 命令正则表达式

Linxu常用命令技巧汇总

《Linux命令行与Shell脚本编程大全第2版.布卢姆》pdf

ACS基本配置-权限等级管理