常规的质控和过滤数据是fastqc+trimmomatic,据说fastp更快,而且一次完成质控过滤和出图。
fastp的github
fastp的出版地址
1.Fastp 软件安装
wget http://opengene.org/fastp/fastp
chmod a+x ./fastp
./fastp
本地路径/home/chaim/disk/soft/fastp/fastp
添加环境变量
vim ~/.bash_profile
export PATH=$home/disk/soft/fastp:PATH
之后即可全局调用fastp。
2.使用参数
2.1 快速处理
单端测序single end(SE)
fastp -i in.fq -o out.fq
双端测序paired end(PE)
fastp -i in.R1.fq.gz -I in.R2.fq.gz -o our.R1.fq.gz -O out.R2.fq.gz
参数设定:
-w 8 设置进程数8,默认2,max=16,或者是--thread 8
-z 5 设置gzip压缩级别,默认4,1~9 1快-9小
--json 设置输出json文件名
--html 设置输出html文件名
2.2 使用循环批量处理
注意:一定要修改默认的输出文件名,不然后面的输出会覆盖前面的默认文件名
#!/bin/bash
for i in 71 72 75 76 78 79;do
{
fastp -i ~/RNAseq/SRR190242${i}_1.fastq.gz -o SRR190242${i}_1.fastq.gz -I ~/RNAseq/SRR190242${i}_2.fastq.gz -O SRR190242${i}_2.fastq.gz -w 8 --html ${i}.html --json ${i}.json
}
done