awk实际应用：文本合并

2017-11-25 23:50:00

请使用awk命令将如下两份文件中名字相同的两行合并起来

<code>[root@localhost ~]</code><code># cat 1.txt</code>

<code>[root@localhost ~]</code><code># cat 2.txt</code>

输出效果：

韩海林 21岁男

<code>[root@localhost ~]</code><code># awk 'NR==FNR{a[$1]=$2}NR>FNR{print $0,a[$1]}' 2.txt 1.txt</code>

<code>[root@localhost~]</code><code># awk 'NR==FNR{a[$1]=$2}NR>FNR{print $0,a[$1]}' 2.txt 1.txt > 3.txt</code>

<code>[root@localhost ~]</code><code># cat 3.txt </code>

解释：

在awk里，NR和FNR的含义相近，唯一的区别就是作用范围，NR是所有读取的行信息计数，而FNR是正在读取文件的行信息计数，FNR在文件切换时会从0重新开始计数，所以上述语句的意思是：

NR==FNR NR最大值为4，FNR值为1-4，以2.txt的第一个数据项为key，$2即第2列为数据组成数组；

NR>FNR 此时NR=（2.txt的总行数+FNR），NR最大值为8，FNR则重新从1-4计数，判断第一个数据项在不在2.txt数据组成的数组里，如果在，则打印本行加数组项。

NR是英文number of record的简写，就是awk每从文件或输入流中读入一行数据，就把这个变量加一。这个是awk自带的变量。

其他的解释：

NR==FNR{a[$1]=$2}

打开第一个文件2.txt，把文件里面的$2列的内容存入到a[$1]这个数组。

NR>FNR{print $0,a[$1]}

然后打开第二个文件，打印1.txt一行内容，然后打印第一个文件a[$1]数组的内容。

加入if判断，更容易理解，上面的命令省略了；判断1.txt的第一列内容在a数组里面，打印整行内容和a[$1]数组内容；

<code>[root@localhost ~]</code><code># awk 'NR==FNR{a[$1]=$2;next}NR>FNR{if($1 in a)print $0,a[$1]}' 2.txt 1.txt </code>

文件顺序不同，结果也不同；

<code>[root@localhost ~]</code><code># awk 'NR==FNR{a[$1]=$2}NR>FNR{print $0,a[$1]}' 1.txt 2.txt </code>

<code></code><code>本文转自模范生 51CTO博客，原文链接：http://blog.51cto.com/mofansheng/1671764，如需转载请自行联系原作者</code>

继续阅读