利用awk自身变量NR和FNR来处理多个文件

原文:http://521cto.blog.51cto.com/950229/945683

利用awk自身变量NR和FNR来处理多个文件2012年 07月 27日 星期五 22:31:10 CST这里不再介绍awk的基本用法,如果连基本用法都不知道的同学先提前学习下基本用法,再看下面的介绍,本文简单介绍了如何使用数组,以及对awk自身变量NR和FNR的意义和区别进行介绍,并以实例的方式展示。数组也是变量,但是数组可以保存一组值或者一组元素,每个元素可以通过下标访问。awk的数组跟其他程序设计语言的数组有所不同:1、不需要正式定义,一个数组在使用时被定义;2、数组元素的初始值为0或空字符串,除非他们被显示的指定初始化;3、数组可以自动扩展;4、下标可以使字符串。
NR:表示awk开始执行程序后所读取的数据行数。FNR:awk当前读取的记录数,其变量值小于等于NR(比如当读取第二个文件时,FNR是从0开始重新计数,而NR不会)。
NR==FNR:用于在读取两个或两个以上的文件时,判断是不是在读取第一个文件。
awk处理多个文件的基本语法是:awk -F分隔符 'BEGIN { 初始化 } { 循环执行部分 } END { 结束处理 }' file_list1 file_list2其中BEGIN和END可以省略,-F也可以使用默认,循环执行部分,是按行对文件进行处理的。
下面通过两个实例来理解NR和FNR:
1, 对于单个文件NR 和FNR 的 输出结果一样的 :文件内容如下:

[root@tech tmp]# cat a
a b c d
a b d c
a c b d
[root@tech tmp]# cat b
aa bb cc dd
aa bb dd cc
aa cc bb dd

对单个文件处理:
[root@tech tmp]# awk '{ print NR,$0 }' a
1 a b c d
2 a b d c
3 a c b d
[root@tech tmp]# awk '{ print FNR,$0 }' a
1 a b c d
2 a b d c
3 a c b d

2, 但是对于多个文件,NR和FNR代表的含义和区别:
[root@tech tmp]# awk '{ print NR,$0 }' a b
1 a b c d
2 a b d c
3 a c b d
4 aa bb cc dd
5 aa bb dd cc
6 aa cc bb dd
[root@tech tmp]# awk '{ print FNR,$0 }' a b
1 a b c d
2 a b d c
3 a c b d
1 aa bb cc dd
2 aa bb dd cc
3 aa cc bb dd

再看一个例子关于NR和FNR的典型应用:
现在有两个文件格式如下:
[root@tech tmp]# cat account
李四|000002
张三|000001
王五|000003
赵六|000004
[root@tech tmp]# cat cdr
000001|10
000001|20
000002|30
000002|15
000002|45
000003|40
000003|25
000004|60

执行如下代码

张三|000001|10
张三|000001|20
李四|000002|30
李四|000002|15
李四|000002|45
王五|000003|40
王五|000003|25
赵六|000004|60
执行如下代码
[root@tech tmp]# awk -F | 'NR==FNR { a[$2]=$0; next } { print a[$1]"|"$2 }' account cdr
张三|000001|10
张三|000001|20
李四|000002|30
李四|000002|15
李四|000002|45
王五|000003|40
王五|000003|25
赵六|000004|60

注释:
当NR=FNR为真时,判断当前读入的是第一个文件account,然后使用{ a[$2]=$0; next }循环将account文件的每行记录都存入数组a,并使用$2第2个字段作为下标引用.
当NR=FNR为假时,判断当前读入了第二个文件cdr,然后跳过{a[$2]=$0;next},对第二个文件cdr的每一行都无条件执行{ print a[$1]"|"$2 },此时变量$1为第二个文件的第一个字段,与读入第一个文件时,采用第一个文件第二个字段$2为数组下标相同.因此可以在此使用a[$1]引用数组。
再比如:file11 billchen mp2 allenquan zhanghu3 collenswang jieru
file21 shenzhen guangdong2 jinan shandong3 nanchang jiangxi
我们用awk来处理文件:
1、先看下面两个例子:[root@tech tmp]# awk -F' ' 'NR==FNR { a[$2]=$3 } END { for(i in a) { print i,a[i] } }' file1 file2collenswang jieruallenquan zhanghubillchen mp
当NR==FNR时,执行a[$2]=$3,以$2为下标,以$3为值,循环执行。
注意区别:将上面例子$2改为NR[root@tech tmp]# awk -F' ' 'NR==FNR { a[NR]=$3 } END { for(i in a) { print i,a[i] } }' file1 file21 mp2 zhanghu3 jieru
当NR==FNR时,执行a[NR]=$3,以NR为下标,以$3为值,循环执行。
2、再看下面两个例子:[root@tech tmp]# awk -F' ' 'NR!=FNR { a[$2]=$3 } END { for(i in a) { print i,a[i] } }' file1 file2nanchang jiangxishenzhen guangdongjinan shandong
当NR!=FNR时,执行a[$2]=$3,以$2为下标,以$3为值,循环执行。
注意区别:将上面例子$2改为NR[root@tech tmp]# awk -F' ' 'NR!=FNR { a[NR]=$3 } END { for(i in a) { print i,a[i] } }' file1 file24 guangdong5 shandong6 jiangxi当NR!=FNR时,执行a[NR]=$3,以NR为下标,以$3为值,循环执行。
3、再将它们组合起来进行多文件处理:[root@tech tmp]# awk -F' ' 'NR==FNR { a[$2]=$3 } NR!=FNR { b[$2]=$3 } END { for(i in a) { print i,a[i] } print "--------"; for(j in b) { print j,b[j] } }' file1 file2collenswang jieruallenquan zhanghubillchen mp--------nanchang jiangxishenzhen guangdongjinan shandong
当NR==FNR时,执行a[$2]=$3,以$2为下标,以$3为值,当NR!=FNR时,执行b[$2]=$3,循环执行。
注意区别:将上面例子$2改为NR[root@tech tmp]# awk -F' ' 'NR==FNR { a[NR]=$3 } NR!=FNR { b[NR]=$3 } END { for(i in a) { print i,a[i] } print "--------"; for(j in b) { print j,b[j] } }' file1 file21 mp2 zhanghu3 jieru--------4 guangdong5 shandong6 jiangxi当NR==FNR时,执行a[NR]=$3,以NR为下标,以$3为值,当NR!=FNR时,执行b[NR]=$3,循环执行。
下面是我将命令单独摘出供大家对比:awk -F' ' 'NR==FNR { a[$2]=$3 } END { for(i in a) { print i,a[i] } }' file1 file2awk -F' ' 'NR==FNR { a[NR]=$3 } END { for(i in a) { print i,a[i] } }' file1 file2awk -F' ' 'NR!=FNR { a[$2]=$3 } END { for(i in a) { print i,a[i] } }' file1 file2awk -F' ' 'NR!=FNR { a[NR]=$3 } END { for(i in a) { print i,a[i] } }' file1 file2awk -F' ' 'NR==FNR { a[$2]=$3 } NR!=FNR { b[$2]=$3 } END { for(i in a) { print i,a[i] } print "--------"; for(j in b) { print j,b[j] } }' file1 file2awk -F' ' 'NR==FNR { a[NR]=$3 } NR!=FNR { b[NR]=$3 } END { for(i in a) { print i,a[i] } print "--------"; for(j in b) { print j,b[j] } }' file1 file2
注:awk把一串连续的空格符合制表符(即空白串)当做一个默认分隔符可以去掉: -F' ' ,上述命令可以简写如下:awk 'NR==FNR { a[$2]=$3 } END { for(i in a) { print i,a[i] } }' file1 file2awk 'NR==FNR { a[NR]=$3 } END { for(i in a) { print i,a[i] } }' file1 file2awk 'NR!=FNR { a[$2]=$3 } END { for(i in a) { print i,a[i] } }' file1 file2awk 'NR!=FNR { a[NR]=$3 } END { for(i in a) { print i,a[i] } }' file1 file2awk 'NR==FNR { a[$2]=$3 } NR!=FNR { b[$2]=$3 } END { for(i in a) { print i,a[i] } print "--------"; for(j in b) { print j,b[j] } }' file1 file2awk 'NR==FNR { a[NR]=$3 } NR!=FNR { b[NR]=$3 } END { for(i in a) { print i,a[i] } print "--------"; for(j in b) { print j,b[j] } }' file1 file2上面简写命令读者可以运行测试,结果跟原来的是一样的。
以下是我的详细运行结果,仔细对比即可找到规律:[root@tech tmp]# more file1 file2::::::::::::::file1::::::::::::::1 billchen mp2 allenquan zhanghu3 collenswang jieru::::::::::::::file2::::::::::::::1 shenzhen guangdong2 jinan shandong3 nanchang jiangxi[root@tech tmp]# awk -F' ' 'NR==FNR { a[$2]=$3 } END { for(i in a) { print i,a[i] } }' file1 file2collenswang jieruallenquan zhanghubillchen mp[root@tech tmp]# awk -F' ' 'NR==FNR { a[NR]=$3 } END { for(i in a) { print i,a[i] } }' file1 file21 mp2 zhanghu3 jieru[root@tech tmp]# awk -F' ' 'NR!=FNR { a[$2]=$3 } END { for(i in a) { print i,a[i] } }' file1 file2nanchang jiangxishenzhen guangdongjinan shandong[root@tech tmp]# awk -F' ' 'NR!=FNR { a[NR]=$3 } END { for(i in a) { print i,a[i] } }' file1 file24 guangdong5 shandong6 jiangxi[root@tech tmp]# awk -F' ' 'NR==FNR { a[$2]=$3 } NR!=FNR { b[$2]=$3 } END { for(i in a) { print i,a[i] } print "--------"; for(j in b) { print j,b[j] } }' file1 file2collenswang jieruallenquan zhanghubillchen mp--------nanchang jiangxishenzhen guangdongjinan shandong[root@tech tmp]# awk -F' ' 'NR==FNR { a[NR]=$3 } NR!=FNR { b[NR]=$3 } END { for(i in a) { print i,a[i] } print "--------"; for(j in b) { print j,b[j] } }' file1 file21 mp2 zhanghu3 jieru--------4 guangdong5 shandong6 jiangxi感谢各位前辈的指点,以及对awk相关知识的贡献,同时谢谢以下参考页面的原作者。本地同名文件以附件的形式上传了,读者可以下载参考。
参考页面:1、http://blog.163.com/xychenbaihu@yeah/blog/static/132229655201222771550599/2、http://www.linuxidc.com/Linux/2012-05/61174.htm

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,491评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,856评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,745评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,196评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,073评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,112评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,531评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,215评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,485评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,578评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,356评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,215评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,583评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,898评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,497评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,697评论 2 335

推荐阅读更多精彩内容

  • 1、Nginx日志分析日志格式:'$remote_addr - $remote_user [$time_local...
    运维前线阅读 696评论 0 4
  • 转载 原文的排版和内容都更加友好,并且详细,我只是在这里贴出了一部分留作自己以后参考和学习,如希望更详细了解AWK...
    XKirk阅读 3,177评论 2 25
  • awk命令的基本使用 [root@shellscript ~]# head -n 3 /etc/passwd | ...
    古寒飞阅读 1,054评论 0 2
  • 做人有深度 炒股有套路!龙辉在把晚间聊股学习总结的给大家分享,希望龙辉的分享能给您带来帮助! 常言道,“常...
    龙辉丿阅读 202评论 0 0
  • 七:妈妈 我今天不要扎wanzitou 妈妈:丸子头很适合你 扎起来很漂亮的 七:hey,可我是女孩诶,我不要王子...
    温筱冰阅读 242评论 1 1