grep、egrep和正则表达式的总结

本文主要讲述grep和egrep的使用，已经在这两个命令中用到的正则表达式的一些简单的应用和事例

一、grep的使用

1.grep的解释

grep为global search regular expression(RE) and print out the line的缩写，即根据用户指定的文本搜索模式对目标文件进行搜索并显示能够被模式匹配到的行的一种文本搜索工具。

2.grep的使用格式

gerp [options] 'PATTERN'file,....

其中PATTERN项需要使用''或者"",如果需要对模式进行转换，则需要使用""，如果不需要进行转换，则使用''或""都可以。模式还可以使用正则表达式来表示。

3.grep的常用选项

--color：用来指定被模式匹配到的字符的显示颜色，参数选项有never，always和auto

-v：反向匹配，即不能被模式所匹配到的行，也可以使用--invert-match长选项

-o：只显示被模式匹配到字符串，而非显示整行（grep默认显示被匹配到的整行）

-i：不区分大小写，也可以使用--ignore-case长选项

-E：支持扩展的正则表达式，相当于egrep

-r: 连带文件夹以下目录也查找

-A：与数字一起使用，显示被模式匹配到的行并且显示被匹配到的行的下面多少行

-B: 与数字一起使用，显示被模式匹配到的行并且显示被匹配到的行的上面多少行

-C: 与数字一起使用，显示被模式匹配到的行并且显示被匹配到的行的上查找下各显示多少行

二、正则表达式的使用

1.正则表达式的解释

正则表达式是一类字符所书写的模式，是由一些ASCII码类字符和一些元字符组成。正则表达式工作在贪婪模式下，尽可能多的去匹配字符。

元字符不表示字符本身的意义，而是用于额外功能性的描述

2.正则表达式的分类

正则表达式从功能上可以分为基本正则表达式和扩展正则表达式

3.基本正则表达式中元字符的使用

1）字符匹配

.:表示匹配任意一个字符

案例：要求显示/etc/passwd中以s和h之间出现任意字符的

<code>[root@localhost ~]# grep </code><code>"s.h"</code> <code>/etc/passwd</code>

<code>sshd:x:</code><code>74</code><code>:</code><code>74</code><code>:Privilege-separated SSH:/</code><code>var</code><code>/empty/sshd:/sbin/nologin</code>

[]:匹配指定范围内的单个字符

案例：要求显示/etc/fstab中出现c和C的行

<code>[root@localhost ~]# grep </code><code>"[cC]"</code> <code>/etc/fstab</code>

<code># /etc/fstab</code>

<code># Created by anaconda on Mon Feb </code><code>10</code> <code>10</code><code>:</code><code>21</code><code>:</code><code>28</code> <code>2014</code>

<code># Accessible filesystems, by reference, are maintained under </code><code>'/dev/disk'</code>

<code>UUID=58894bb8-5b23-4f00-baff-0c19d450bfe9 /boot ext4 defaults </code><code>1</code> <code>2</code>

<code>proc /proc proc defaults </code><code>0</code> <code>0</code>

[^]:匹配指定范围外的单个字符，也可使使用选项v来完成

案例，显示/etc/passwd中没有出现#的行

<code>[root@localhost ~]# grep -v </code><code>'#'</code> <code>/etc/fstab</code>

<code>/dev/mapper/vg0-root / ext4 defaults </code><code>1</code> <code>1</code>

<code>/dev/mapper/vg0-usr /usr ext4 defaults </code><code>1</code> <code>2</code>

<code>/dev/mapper/vg0-</code><code>var</code> <code>/</code><code>var</code> <code>ext4 defaults </code><code>1</code> <code>2</code>

<code>/dev/mapper/vg0-swap swap swap defaults </code><code>0</code> <code>0</code>

<code>tmpfs /dev/shm tmpfs defaults </code><code>0</code> <code>0</code>

<code>devpts /dev/pts devpts gid=</code><code>5</code><code>,mode=</code><code>620</code> <code>0</code> <code>0</code>

<code>sysfs /sys sysfs defaults </code><code>0</code> <code>0</code>

指定范围的字符还可以使用一些别的元素组成，如

[[:space:]]:表示空白字符

[[:lower:]]:表示所有小写字母

[[:upper:]]:表示所有大写字母

[[:aplha:]]:表示所有字母，也可使用[a-z]表示

[[:digit:]]:表示所有的数字，也可以使用[0-9]表示

[[:almun:]]:表示所有的数字和字母

[[:punct:]]:表示所有特殊字符

2）次数匹配：用来指定匹配其前面字符出现的次数，只能匹配模式紧靠着的一个字符

*：出现任意次

.*: 出现任意次的任意字符

\?: 出现0次或者1次

\{m\}: 表示出现m次

\{m,n\}: 表示至少出现m次，至多出现n次

\{m,\}: 表示最少出现m次

\{0,n\}：表示至多出现n次，其中0不能省略

案例：显示/etc/passwd中r后面出现最少一次，最多2次的

<code>[root@localhost ~]# grep </code><code>"ro\{1,2\}"</code> <code>/etc/passwd</code>

<code>operator:x:</code><code>11</code><code>:</code><code>0</code><code>:operator:/root:/sbin/nologin</code>

<code>rtkit:x:</code><code>499</code><code>:</code><code>497</code><code>:RealtimeKit:/proc:/sbin/nologin</code>

3）位置锚定符：用于来指定字符出现的位置

^:用于锚定行首，用法为^Char

$:用于锚定行尾，用法为Char$

^$:用来表示空白行

案例：统计/etc/rc.d/rc.sysinit中出现的空白行

<code>[root@localhost ~]# grep </code><code>"^$"</code> <code>/etc/rc.d/rc.sysinit |wc -l</code>

4）单词的锚定：所有非自然的单词

\<:用于锚定单词的词首，也可以使用\b表示，用法为\<Char或\bChar

\>:用于锚定单词的行尾，也可以使用\b表示，用法为Char\>或Char\b

案例：显示/etc/passwd中root的行

<code>[root@localhost ~]# grep </code><code>"\<root\>"</code> <code>/etc/passwd</code>

5) 分组：对模式进行分组

6) 引用：对分组的字符串基于位置引用

\1: 后向引用，表示引用前面的第一个左括号与之对应的右括号中的模式所匹配到的内容

\2: 表示引用前面的第二个左括号与之对应的右括号中的模式所匹配到的内容

...

例：此处不适合于英文状态，只是做实例分析

He like his lover

She love her liker

He loves his lover

She like his liker

要求：前面显示like的后面显示liker，前面显示love的后面显示lover

<code>[root@localhost ~]# grep </code><code>"$l..e$.*\1r"</code> <code>i.txt</code>

<code>He loves his lover</code>

<code>She like his liker</code>

4.扩展正则表达式的使用

1）字符匹配

[]:匹配指定范围内的单个字符

[^]:匹配指定范围外的单个字符，也可使使用选项v来完成

指定范围的字符还可以使用一些别的元素组成，如

?: 出现0次或者1次

+: 至少出现1次

{m}: 表示出现m次

{m,n}: 表示至少出现m次，至多出现n次

{m,}: 表示最少出现m次

{0,n}：表示至多出现n次，其中0不能省略

三、egrep的使用

egrep相当于grep -E，使用扩展正则表达式来构建模式，此处不再累赘

由于本人水平有限，如出现错误，请大家多多指正

练习：

1、显示/proc/meminfo文件中以大小写s开头的行；

# grep "^[sS]" /proc/meminfo

# grep -i "^s" /proc/meminfo

2、取出默认shell为非bash的用户；

# grep -v "bash$" /etc/passwd | cut -d: -f1

3、取出默认shell为bash的且其ID号最大的用户；

# grep "bash$" /etc/passwd | sort -n -t: -k3 | tail -1 | cut -d: -f1

4、显示/etc/rc.d/rc.sysinit文件中，以#开头，后面跟至少一个空白字符，而后又有至少一个非空白字符的行；

# grep "^#[[:space:]]\{1,\}[^[:space:]]\{1,\}" /etc/rc.d/rc.sysinit

5、显示/boot/grub/grub.conf中以至少一个空白字符开头的行；

# grep "^[[:space:]]\{1,\}[^[:space:]]\{1,\}" /boot/grub/grub.conf

6、找出/etc/passwd文件中一位数或两位数；

# grep --color=auto "\<[0-9]\{1,2\}\>" /etc/passwd

7、查看当前系统上root用户的所有信息;

# grep "^root\>" /etc/passwd

8、添加用户bash和testbash、basher，而后找出当前系统上其用户名和默认shell相同的用户；

# grep --color=auto "^$[[:alnum:]]\{1,\}$\>.*\1$" /etc/passwd

本文转自wangfeng7399 51CTO博客，原文链接：http://blog.51cto.com/wangfeng7399/1360804，如需转载请自行联系原作者

grep、egrep和正则表达式的总结

继续阅读

spec文件详解

网络空间安全中高职业院校职技能大赛——Telnet弱口令渗透测试

Windows下使用GSL（GNU Scientific Library）

HK-2000数据采集仪数据库操作说明

终端环境之tmux

查找文件中的字符串

windows不能在本地计算机上运行oracleDbConsoleorcl

Windows下VS开发环境环境安装工程项目设置关于Debug和Release的提示

拒绝用户登录:/bin/false和/usr/sbin/nologin

Shell编程——sort排序、uniq忽略重复、tr替换压缩删除、cut指定删除字段、正则表达式元字符sort 命令uniq 命令tr 命令cut 命令正则表达式

Linxu常用命令技巧汇总

Windows下配置Apache的SSL服务

《Linux命令行与Shell脚本编程大全第2版.布卢姆》pdf

Mac｜Windows系统本地照片自动上传到服务器

ACS基本配置-权限等级管理

Bugku-WEB-web33