天天看点

Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

awk

  • 一、awk 工具介绍
    • 1.工作原理
    • 2.命令格式
  • 二、awk 用法
    • 1.输出行用法
    • 2.输出列用法
    • 3.通过管道,双引号调用 shell 命令
    • 4.cpu使用率
  • 总结

一、awk 工具介绍

1.工作原理

逐行读取文本,默认以空格或tab键为分隔符进行分隔,将分隔所得的各个字段保存到内建变量中,并按模式或者条件执行编辑命令。

sed命令常用于一整行的处理,而awk比较倾向于将一行分成多个“字段”然后再进行处理。awk信息的读入也是逐行读取的,执行结果可以通过print的功能将字段数据打印显示。在使用awk命令的过程中,可以使用逻辑操作符“&&”表示“与”、“11”表示“或”、“!”表示“非”;还可以,进行简单的数学运算,如+、 -、*、/、号、^分别表示加、减、乘、除、取余和乘方。

2.命令格式

awk    [选项]   '模式或条件{操作}'   文件1  文件2....
awk -f  脚本文件   文件1   文件2...
           

awk常见的内建变量(可直接用)

选项 说明
FS 列分割符。指定每行文本的字段分隔符,默认为空格或制表位。与“-F” 作用相同
NF 当前处理的行的字段个数。
NR 当前处理的行的行号(序数)。
$0 当前处理的行的整行内容。
$n 当前处理行的第n个字段(第n列)。
FILENAME 被处理的文件名。
RS 行分隔符。awk从文件上读取资料时,将根据RS的定义把资料切割成许多条记录,而awk一次仅读入一条记录,以进行处理。预设值是’\n’

二、awk 用法

1.输出行用法

输出所有内容

[[email protected] dhcp]# awk '{print}' abc
[[email protected] dhcp]# awk '{print $0}' abc
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

输出1到3行内容

[[email protected] dhcp]# awk 'NR==1,NR==3 {print}' abc
[[email protected] dhcp]# awk 'NR>=1 && NR<=3 {print}' abc
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

输出第一行或者第三行内容

[[email protected] dhcp]# awk 'NR==1 || NR==3 {print}' abc
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

输出奇数行内容

[[email protected] dhcp]# awk '(NR%2)==1{print}' abc
           

输出偶数行内容

[[email protected] dhcp]# awk '(NR%2)==0{print}' abc
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

输出以root开头行内容

[[email protected] dhcp]# awk '/^root/{print}' /etc/passwd
           

输出bash结尾行内容

[[email protected] dhcp]# awk '/bash$/{print}' /etc/passwd
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结
awk 'BEGIN {x=0};/\/bin\/bash$/{x++};END {print x}' /etc/passwd    
统计以/bin/bash结尾的行数,等同于grep -c "/bin/bash$" /etc/passwd
           

BEGIN模式表示,在处理指定的文本之前,需要先执行BEGIN模式中指定的动作: awk 再处理指定的文本,之后再执行END模式中指定的动作,END{)语句块中,往往会放入打印结果等语句

Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

2.输出列用法

输出每行的第一列的内容

[[email protected] dhcp]# awk -F: '{print $1}' /etc/passwd
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

输出每行的第一列和第三列的内容

[[email protected] dhcp]# awk -F: '{print $1,$3}' /etc/passwd
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

输出第三列数字小于5的第一列和第三列的内容

[[email protected] dhcp]# awk -F: '$3<5{print $1,$3}' /etc/passwd
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

输出第三列数字大于5的取反的内容

[[email protected] dhcp]# awk -F: '!($3>5){print $0}' /etc/passwd
[[email protected] dhcp]# awk 'BEGIN {FS=":"};{if($3<5){print}}' /etc/passwd
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

($3>=$4)?$3:$4三元运算符,如果第3个字段的值大于等于第4个字段的值,则把第3个字段的值赋给max,否则第4个字段的值赋给max

[[email protected] dhcp]# awk -F ":" '{max=($3>=$4)?$3:$4;{print max}}' /etc/passwd
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

输出每行内容和行号

[[email protected] dhcp]# awk -F ":" '{print NR,$0}' /etc/passwd
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

输出以冒号分隔且第7个字段中包含/bash的行的行

[[email protected] dhcp]# awk -F ":" '$7~"/bash"{print $0}' /etc/passwd
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

输出第1个字段中包含root且有7个字段的行的第1、2列内容

[[email protected] dhcp]# awk -F":" '($1~"root") && (NF==7){print $1,$2}' /etc/passwd
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

输出第7个字段既不为/bin/bash,也不为/sbin/nologin的所有行

[[email protected] dhcp]# awk -F ":" '($7!="/bin/bash") && ($7!="/sbin/nologin"){print}' /etc/passwd
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

3.通过管道,双引号调用 shell 命令

[[email protected] dhcp]# echo $PATH | awk 'BEGIN{RS=":"};END{print NR}'
统计以冒号分隔的文本段落数,END{}语句块中,往往会放入打印结果等语句

[[email protected] dhcp]# awk -F: '/bash$/{print | "wc -l"}' /etc/passwd
调用wc -1命令统计使用bash 的用户个数,等同于grep -c "bash$" /etc/ passwd

[[email protected] dhcp]# awk -F: '/bash$/{print}' /etc/passwd | wc -l
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结
查看当前内存使用百分比
[[email protected] dhcp]# free -m | awk '/Mem:/ {print int ($3/ ($3+$4)*100)"%"}'

查看当前CPU空闲率,(-b -n1表示只需要1次的输出结果)
[[email protected] dhcp]# top -b -n1 | grep Cpu | awk -F ',' '{print $4}' | awk '{print $1}' 
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结
[[email protected] dhcp]# date -d "$(awk -F. '{print $1}' /proc/uptime) second ago'

[[email protected] dhcp]# date -d "$(awk -F "." '{print $1}' /proc/uptime) second ago" +"%F %H:%M:%S"
显示上次系统重启时间,等同于uptime; second ago为显示多少秒前的时间,+"%F %H:%M:%S"等同于+"%Y-%m-%d %H: %M: %S"的时间格式
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结
[[email protected] dhcp]# awk 'BEGIN {n=0 ; while ("w" | getline) n++ ; {print n-2}}' 
调用w命令,并用来统计在线用户数

[[email protected] dhcp]# awk 'BEGIN {"hostname" | getline ; {print $0}}'
调用hostname, 并输出当前的主机名
           

当get1 ine左右无重定向符“<”或“|”时,awk首先读取到了第一行, 就是1,然后getline,就得到了1下面的第二行,就是2,因为getline之后,awk 会改变对应的NE,NR, FNR和$0等 内部变量,所以此时的$0的值就不再是1,而是2了,然后将它打印出来。

当getline左右有重定向符“<”或“|”时,getline则作用于定向输入文件,由于该文件是刚打开,并没有被awk读入一行,只是getline读入,那么getline返回的是该文件的第一 行,而不是隔行。

输出偶数行
seq 10 | awk '{getline; print $0}'

输出奇数行
seq 10 | awk '{print $0; getline}'
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

4.cpu使用率

#!/bin/bash

sy=`top -b -n1 | grep "Cpu" | awk -F, '{print $4}' | awk -F " " '{print $1}'`
echo "CPU的剩余率:$sy%"

ssy=`top -b -n1 | grep "Cpu" | awk -F, '{print $1}' | awk -F " " '{print $2}'`
ssi=`top -b -n1 | grep "Cpu" | awk -F, '{print $2}' | awk -F " " '{print $1}'`

sum=`echo "$ssy+$ssi" | bc `

echo "使用率 $sum%"
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

echo “A B C D” | awk ’ {OFS=“I”;print $0;$1=$1;print $0}’

A B C D

AIBICID

$1=$1是用来激活$0的重新赋值,也就是说

字段$1…和字段数NF的改变会促使awk重新计算$0的值,通常是在改变0FS后而需要输出$0时这样做

使用awk统计httpd访问日志中每个客户端IP的出现次数?

答案:

awk ‘{ip[$1]++}END{for(i in ip) {print ip[i],i}’ /var/log/httpd/access_log | sort -r

备注:定义数组,数组名称为ip,数字的下标为日志文件的第1列(也就是客户端的IP地址),++的日的在于对客户端进行统计计数,客户端

IP出现一次计数器就加1。END中 的指令在读取完文件后执行,通过循环将所有统计信息输出,for 循环遍历的是数组名ip的下标。

awk ’ BEGIN{a[0]-10;a[1]-20; print a[1]}’

awk ’ BEGIN{a[0]=10;a[1]=20; print a[0}}’

awk ‘BEGIN{a[“abc”]=10;a[“xyz”]=20;print a[“abc”]}’

awk ’ BEGIN{a[“abc”]=10;a[“xyz”]=20;print a[“xyz”]}’

awk ’ BEGIN{a[“abc”]=" aabbcc" ;a [“xyz”]=“xxyyzz” ;print a[“xyz”]}’

awk ’ BEGIN{a[0]=10;a[1]=20;a[2]=30;for(i in a) {print i,a[i]} }

PS1: BEGIN中 的命令只执行一次

PS2: awk数组的下标除了可以使用数字,也可以使用字符串,字符串需要使用双引号

#!/bin/bash

x=`awk '/failed/{ip[$11]++}END{for(i in ip){print i ","ip[i]}}' /var/log/secure`
for a in $x
do
ip=`echo $a | awk -F "," '{print $1}'`
sum=`echo $a | awk -F "," '{print $2}'`
if [ $sum -ge 3 ]
then
echo "警告!$ip访问失败了$sum次。"
fi
done
           
Linux三剑客-----awk一、awk 工具介绍二、awk 用法总结

总结

DHCP 自动部署

#!/bin/bash
cp /usr/share/doc/dhcp-4.2.5/dhcpd.conf.example /etc/dhcp/dhcpd.conf

read -p "请输入网段:" bb
read -p "请输入网关ip:" dd
read -p "请输入起始ip:" aa
read -p "请输入结束ip:" cc

fa () {
sed -i 's/#ddns-update-style none/ddns-update-style none/' /etc/dhcp/dhcpd.conf

sed -i '6 a option domain-name-servers 8.8.8.8;' /etc/dhcp/dhcpd.conf

sed -i "31 a subnet $bb netmask 255.255.255.0 {" /etc/dhcp/dhcpd.conf

sed -i "32 a range $aa $cc;" /etc/dhcp/dhcpd.conf

sed -i "33 a option routers $dd;\n}" /etc/dhcp/dhcpd.conf

systemctl restart dhcpd
}

fa
           

DNS 自动部署

#!/bin/bash

#/etc/named.conf                  主配置文件
#/etc/named.rfc1912.zones         区域配置文件
#/var/named/named.localhost       区域数据配置文件

sed -i '13d' /etc/named.conf
sed -i '12 a listen-on port 53 { any; };' /etc/named.conf
sed -i '14d' /etc/named.conf
sed -i '18d' /etc/named.conf
sed -i '17 a allow-query    { any; };' /etc/named.conf

sed -i '24 a zone "benet.com" IN {\n\ttype master;\n\tfile "benet.com.zone";\n\tallow-update  { none; };\n};\n' /etc/named.rfc1912.zones

#touch /var/named/benet.com.zone

cp -p /var/named/named.localhost /var/named/benet.com.zone

sed -i '1i $TTL 1D\n@      IN SOA   benet.com. admin.benet.com. (\n              0            ;serial   \n              1D           ;refresh   \n              1H           ;retry \n              1W           ;expire  \n              3H )         ;minimum   \n\n       NS        benet.com.           \n      A         192.168.241.10     \nwww  IN   A    192.168.241.10' /var/named/benet.com.zone

sed -i '12,$d' /var/named/benet.com.zone

systemctl restart named
systemctl stop firewalld.service
setenforce 0
           

继续阅读