准备文件
物种A参考基因组,以及测序文件.fastq
测序文件质控
这里用trim_galore,为什么用trim_galore,因为它可以自动检测接头,并且不只是illumina的接头,还有nextera和small_rna
首先trim_galore依赖于cutadapt和fastqc,可以参照https://github.com/FelixKrueger/TrimGalore
# 检查cutadapt是否安装
cutadapt --version
# 检查fastqc是否安装
fastqc -v
fastqc已经安装好,cutadapt还没有安装
# 这里用conda来装cutadapt
conda install cutadapt
开始去接头
trim_galore -q 6 --length 16 --paired SRRnnnnnnnn_1.fastq SRRnnnnnnnn_2.fastq -o ../work_fold/trim
可以加个--fastqc参数,这样可以生成质控报告
开始比对
bowtie2-build建立索引
bowtie2-build A_reference_genome.fa ../../index/A
确定测序文件是单端还是双端