awk与sed命令用法整理

awk

awk是一种处理文本文件的语言，在对数据分析并生成报告时，表现的十分强大，简单来说awk就是八人间逐行的读入,以空格为默认分割符将每行切片，切开的部分再进行各种分析梳理。

awk内置的变量

ARGC               命令行参数个数
ARGV               命令行参数排列
ENVIRON            支持队列中系统环境变量的使用
FILENAME           awk浏览的文件名
FNR                浏览文件的记录数
FS                 设置输入域分隔符，等价于命令行 -F选项
NF                 浏览记录的域的个数
NR                 已读的记录数
OFS                输出域分隔符
ORS                输出记录分隔符(默认是换行符)
RS                 输入记录分隔符(默认是换行符)
$0变量是指整条记录。$1表示当前行的第一个域,$2表示当前行的第二个域,......以此类推。
$NF是number finally,表示最后一列的信息，跟变量NF是有区别的，变量NF统计的是每行列的总数

常用awk选项参数说明

-F fs           --field-separator=fs  ：指定输入文件分割符
-v var=val      --assign=var=val  ：赋值一个用户定义变量
-f progfile     --file=progfile   ：从脚本文件中读取awk命令

awk基本用法

用法一：

基本语法

awk '[pattern] {action}' filenames   # 行匹配语句 awk '' 只能用单引号
# pattern 标识过滤条件，支持多条件的与或非，如果是正则的话，pattern需包含在// 两个斜杠中间
# 这里action表示要进行的操作
# filenames 表示进行操作的文件，如果是多个文件，则需用大括号括起来，并以，分割 {文件1，文件2}
# 举例
# awk '{print $1,$4}' log.txt   ：直接输出文本中的第一第四项
# awk  '/root/' /etc/passwd  ： 匹配到root的行才输出，没有指定actoin,默认输出每一行内容

用法二：

基本用法

awk -F  #-F相当于内置变量FS, 指定分割字符
# 默认不指定分割符时，分割符为空格及制表符，这里可以手动设置分割符
# 举例
# awk -F, '{print $1,$2}'   log.txt ：指定分割符为,
# awk -F '[ ,]'  '{print $1,$2,$5}'   log.txt  :指定多个分割符(空格和，)

用法三：

基本用法

awk -v  # 设置变量
# 设置变量方便后续的计算
# 举例
# awk -va=1 '{print $1,$1+a}' log.txt
# 这里设置了变量a=1, 然后打印

用法四：

基本用法

awk -f awk脚本 文件名

BEGIN END

关于awk脚本，我们需要注意两个关键词 BEGIN和END
- BEGIN {这里面是执行前的语句}
- {这里面放的是处理每一行时要执行的语句}
- END {这里面放的是所有行执行后要执行的语句}
基于上面的集中组合，我们就可以实现循环或者是别的一些操作

SED

sed是一个文本编辑命令，不同于vi这种交互型的文本编辑，sed是流编辑模式，在处理数据之前，需要预先提供一组规则，sed会按照此规则来编辑数据。
sed 会根据脚本命令来处理文本文件中的数据，这些命令要么从命令行中输入，要么存储在一个文本文件中，此命令执行数据的顺序如下：
每次仅读取一行内容；
根据提供的规则命令匹配并修改数据。注意，sed 默认不会直接修改源文件数据，而是会将数据复制到缓冲区中，修改也仅限于缓冲区中的数据；
将执行结果输出。
当一行数据匹配完成后，它会继续读取下一行数据，并重复这个过程，直到将文件中所有数据处理完毕。

常用sed选项参数说明

-e 脚本命令  ：将脚本命令添加到已有的命令中
-f 脚本命令文件 : 将文件中的脚本命令添加到已有的命令中
-n : 屏蔽默认状态下的自动输出内容，需要使用print命令来完成输出
-i : 此选项会直接修改源文件

常用sed动作说明

a ：新增， a 的后面可以接字串，而这些字串会在新的一行出现(目前的下一行)
c ：取代， c 的后面可以接字串，这些字串可以取代 n1,n2 之间的行
d ：删除，因为是删除，所以 d 后面通常不接任何内容；
i ：插入， i 的后面可以接字串，而这些字串会在新的一行出现(目前的上一行)；
p ：打印，将某个选择的数据印出。通常 p 会与参数 sed -n 一起运行
s ：取代，可以直接进行取代的工作！通常这个 s 的动作可以搭配正规表示法

sed命令基本用法

基本用法

sed [-hnV][-e<script>][-f<script文件>][文本文件]

# 举例
# 数据新增删除
# sed -e 4a\newline testfile 或 sed '4a newline' test.txt #使用sed 在第四行后添加新字符串  newline
# nl /etc/passwd | sed '2,5d'  # 删除2-5行
# nl /etc/passwd | sed '3,$d'  # 删除3之后的所有行
# nl /etc/passwd | sed '2i drink tea'  #在第二行之前添加字符串
 # nl /etc/passwd | sed '2a Drink tea or ......\
> drink beer ?'   # 在第二行之后添加两行字符串， 需以 \ 标识换行

# 数据替换
# nl /etc/passwd | sed '2,5c No 2-5 number' # 以指定字符串(No 2-5 number)取代2-5行的内容

# 数据显示
# nl /etc/passwd | sed -n '5,7p'  # 仅打印第五和第七行

# 数据搜索
# nl /etc/passwd | sed '/root/p'  # 搜索所有与root有关的行，这里与awk一样，//内为正则匹配
# nl /etc/passwd | sed -n '/root/p'  # 只打印匹配到的记录

# nl /etc/passwd | sed  '/root/d' # 搜索数据并删除匹配到的记录

数据搜索替换

sed最常见的用法应该就是搜索替换，这里单独说明一下

基本用法：[address]s/pattern/replacement/flags
address标识具体要操作的行，pattern标识要被替换的内容，replacement标识替换的新内容
flags的标识如下

n : 1-512之间的数字，表示要替换的字符串第几次出现才进行替换，比如只想替换一行中出现的第二个A
g ：对所有内容进行替换，如果没有g,只会在第一次匹配成功是替换
p : 打印与替换命令中指定的模式匹配的行
w file : 将缓冲区的内容写到指定的file文件中

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,547评论 6赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,399评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,428评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,599评论 1赞 274
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,612评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,577评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,941评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,603评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,852评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,605评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,693评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,375评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,955评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,936评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,172评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,970评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,414评论 2赞 342

awk与sed命令用法整理

awk

awk内置的变量

常用awk选项参数说明

awk基本用法

用法一：

用法二：

用法三：

用法四：

BEGIN END

SED

常用sed选项参数说明

常用sed动作说明

sed命令基本用法

数据搜索替换

推荐阅读更多精彩内容