GAWK（一）：RS、FS与ORS、OFS等内置变量的用法

2023-03-22 22:49:38

AWK作为日志分析的强大工具，如何分割、转换、匹配日志数据是分析的基础，而在分割操作中，最强大而简单的配置莫过于RS与FS，它们的关系如下：

ORS、OFS则用于输出分析报表，但需要注意的是，ORS与OFS只对print函数有效，对printf无效。

下面以一个非寻常格式的数据为例，样本如下：

姓名：甘腾升
年龄：29

姓名：李林
年龄：23

需要将其转换为如下格式的数据：

姓名 年龄
李浩 29
李林 23
总计 3人

那么只需要简单地设置RS、FS即可，awk程序如下：

#! /bin/awk -f
BEGIN {
    RS = "\n\n"
    FS = "\n"
    num = 
    print "姓名", "年龄"
}

#   awk行匹配操作
{
    split($1, name, "：")
    split($2, age, "：")
    num += 
    print name[], age[]
}
#   输出结果
END {
    print "总计", num "人"
}

这里再简单比较以下print与printf的区别：

1. awk中printf函数基本与c语言中的printf函数一样，支持字符串格式化；

2. print函数支持ORS与OFS参数，但不支持字符串格式化操作；

所以简单说，printf格式化字符串全靠手动，print格式化字符串全靠自动。

内置变量	含义
RS	行数据的分割符
FS	列数据的分割符
ORS	行数据的输出分割符
OFS	列数据的输出分割符

需要注意的是，ORS与OFS只对print函数有效，对printf无效，如下：

OFS = "="
for(i = ; i < ; i ++) {
    items[i]["name"] =  "*" i
    items[i]["value"] =  * i
}
#  确定数组的长度
len = length(items) + 
for(i = ; i < ; i ++) {
    print items[i]["name"], items[i]["value"]
    # printf需要手动指定分割符
    #printf("%d \t %d \n", items[i]["name"], items[i]["value"])
}

可能出现的错误

awk程序以Shell脚本方式运行时，提示如下错误：

awk: cmd. line:1: ./multirow.sh
awk: cmd. line:1: ^ syntax error
awk: cmd. line:1: ./multirow.sh
awk: cmd. line:1:   ^ unterminated regexp

错误的原因是解释器声明时忽略了“-f”参数，正确的写法是：

#! /bin/awk -f
# -f绝不可以省略

参考文档

GAWK 入门：AWK 语言基础
Gawk: Effective AWK Programming
awk命令

GAWK（一）：RS、FS与ORS、OFS等内置变量的用法

可能出现的错误

参考文档

继续阅读

Apache (You don't have permission to access / on this server.）

debian9升级4.9.0内核到4.19.2内核过程

centOS7 配置 vsftpd 虚拟用户及权限Vsftpd配置虚拟用户及权限

linux-svn卸载与安装

vsftp虚拟多用户多权限一键部署脚本

Ubuntu14.04 LTS下安装mongodb

Nginx服务优化（1）——隐藏版本号、修改用户与组、网页缓存时间、日志切割、连接超时一、隐藏版本号二、修改用户与组三、配置Nginx网页缓存时间四、实现Nginx日志分割五、配置Nginx实现连接超时六、补充关于时间日期的命令

httpd服务的部署、启动、配置和简单优化一、部署二、启动三、配置文件

配置网页内容访问

手动安装Intel network I217-LM网卡的Linux驱动

禁止ubuntu系统弹出报错界面

Ubuntu Linux下Apache的配置文件

samba服务器的功能

【Linux】UDP广播报文接收速率问题

Linux设备模型（中）之上层容器

PowerPC平台 Linux移植三