grep
只要出现gene字眼都查找出
精确查找,一个单词一个单词的搜索
用于找文件前缀
到file文件里面查找关键词
grep -w -f file
-n显示行号
正则表达式
-
只查找以“T”开头的行
-
模糊匹配的方法 f*ee
grep 'f?ee' 其中 \是转义符
表示f可以出现0次或1次, 查找fee 或者ee- 匹配1次或多次
grep 're+'
表示e可以出现1次或多次,查找 ree, re, ree等
- 匹配1次或多次
-
{n}匹配n次
-
列出以*结尾的文件
一般情况下*可以当做通配符
-
*表示出现0次或者1次
sed
1,练习题目
从第二行开始,使用y函数,ATCG对应TAGC,如果想要保存,利用重定向命令
awk
awk定义
循环语句
先匹配外显子的exon的行,第五列减去第四列
当用cut命令取第九列的时候,取得很多
基因前后的空格都被分割了,取出来
所以需要重新定义分隔符
-F分隔符被重新定义为制表符
打印关于UTR的所有列出来
print和print end 类似于在开头结尾加注释