一,排序:sort
sort常用参数:
-b:忽略开头的空白字符
- -f:将小写字母看做大写字母
- -h:根据存储容量排序
- -n:按数字排序
- -o:将结果写入文件
- -r:以相反的顺序来排序
- -t:指定分隔符,默认为空格
- -V:按照字母版本排序
- -k:指定排序的关键字,与-t参数配合使用
数字排序
把排序结果写入某个文件
指定按照 . 符号进行分隔,然后再指定某排按照大小进行排序
按版本进行排序
二,去除重复:uniq
uniq常用参数(只检查上下行是否重复):
- -c:统计重复出现的次数
- -d:所有临近的重复行只被打印一次。重复次数要大于等于2次
- -D:所有临近的重复行全部打印
- -f:跳过对前n列的比较(只能比较上下行的,如果中间有一列别的,然后再重复,是比较不出来的,所以一般我们先进行排序,然后再去重)
- -s:跳过对前n个字符的比较(跟-f的区别是-f是跳过列,这个是针对字符)
- -w:只对每行前n个字符进行比较
原文件
统计重复出现的次数
只想通过ip地址比较,可以跳过前2列进行比较
以ip地址进行排序,把重复的排到一起,然后再对ip进行去重统计,然后再按照出现次数大小进行倒序排序
所以临近的只被打印一次
所有临近的重复行全部打印
跳过对前n个字符的比较
比较前2个字母连续出现的次数
三,字符统计:wx
wc常用参数:
- -c:统计字节数(chars)
- -l:统计行数
- -w:统计单词数(空格也算,然后每行都有一个分隔符,暂一个字符12+3+9)
-
-L:打印最长的长度