http://www.zsythink.net/archives/1336
awk [options] 'Pattern{Action}' file
BEGIN{} {} END{}
FS field separator
OFS output field separator
awk -F#
awk -v FS='#' OFS=':'
awk '{print $1, $2}' #有分隔符
awk '{print $1 $2}' # 没有分隔符
RS 输入记录分隔符(输入换行符) record separator
ORS 输出记录分隔符(输出换行符) output record separator
NF number of field
NR number of record
FNR 各文件分别计数行号
FILENAME 当前文件名
ARGC 命令行参数
ARGV 数组
awk -v myvar=1234 '{print myvar}'
awk 'BEGIN{myvar="1234", myvar2="aaa"}'
awk '{}' test1 test2 # ARGV=[awk, test1, test2], ARGC=3
print #输出换行符
printf #默认不输出换行符
awk '{printf "%-10s\n", $1}'
awk 'NF==5{print $0}' #输出列数为5的行
awk '/^abc/{print $0}' #输出开头为abc的行
awk -F ":" 'BEGIN{printf "%-10s\t%-10s\n", "username", "userID"} /^abc/{printf "%-10s\t%-10s\n", $1, $3}' /etc/passwd
awk --posix '/he{2,3}y/{print $0}' #匹配heey heeey
awk '/Lee/,/Kevin/{print $0}' #输出第一次出现Lee与第一次出现Kevin之间的行
awk '{ if(NR==1){print $0}}else if(NR==2){print $0}else{}' #只打印第一行, 第二行
<
<=
==
!=
>=
>
~
!~
#for循环语法格式1
for(初始化; 布尔表达式; 更新) {
//代码语句
}
#for循环语法格式2
for(变量 in 数组) {
//代码语句
}
#while循环语法
while( 布尔表达式 ) {
//代码语句
}
#do...while循环语法
do {
//代码语句
}while(条件)
continue, break: also work
exit 结束
next 进行下一行
awk 'BEGIN{huluwa[0]="大娃"; huluwa[1]="二娃"; delete huluwa[1]; delete huluwa;} {if(2 in huluwa){print "huluwa has key 2"}}'
#awk 下标默认从1开始
for(i in huluwa){print i, huluwa[i];}
cat test10
192.168.1.1
...
awk '{count[$1]++} END{for(i in count){print i, count[i];}}'
srand()
rand()
随机数函数可用
print int(rand()*100)
#把$1(第一列)里的l全部换成L
awk '{gsub("l", "L", $1); print $0;}'
gsub全部替换
sub只替换第一个
length($1) #打印字符串长度
index($0, "LEE") #查找正行中LEE的位置(从1开始计数), 0表示没有
splite($0, huluwa, ":") #把整行数据按照:分割为数组, 数组叫huluwa
asort(t) #按照value对数组t从小到大排序, key重置为1, 2, 3...
asorti(t, newt) #取出t中key, 组成数组, 从小到大排序, key重置为1, 2, 3..., key的数组叫newt
支持三元运算符
awk 'i=!i' # 打印奇数行, i为空值为false, !i为true, !i赋值给i, i为true, 因此第一行i为true, action默认为打印全行, 下一行i为true, !i为false, false就不打印全行
awk '!(i=!i)' # 同理, 打印偶数行