1.上Genome Announcements网站(https://mra.asm.org/)找一篇细菌基因组文章,输入Lactobacillus genome(乳酸菌基因组),点击搜索
结果2.点击第二条,找到文章记载的SRA登录号,点击进入
结果3.用prefetch下载SRA文件
prefetch SRR9695707
结果
4.找到SRA文件并解压
fastq-dump --gzip --split-files ~/ncbi/public/sra/ SRR9695707.sra
结果
5.运行fastqc进行质量评价
fastqc SRR9695707_1.fastq.gz SRR9695707_2.fastq.gz
结果
6.运行Trimmomatic去接头
java -jar ~/Biosofts/Trimmomatic038/Trimmomatic-0.38/trimmomatic-0.38.jar PE -phred33 SRR9695707_1.fastq.gz SRR9695707_2.fastq.gz ./trim_out/output_forward_paired.fq.gz ./trim_out/output_forward_unpaired.fq.gz ./trim_out/output_reverse_paired.fq.gz ./trim_out/output_reverse_unpaired.fq.gz ILLUMINACLIP:/home/y/Biosofts/Trimmomatic038/Trimmomatic-0.38/adapters/TruSeq2-PE.fa:2:30:10 SLIDINGWINDOW:5:20 LEADING:20 TRAILING:20 MINLEN:75
结果
7.运行SPAdes,组装细菌基因组
spades.py --careful --pe1-1 output_forward_paired.fq.gz --pe1-2 output_reverse_paired.fq.gz -o ./SPAdesout_new
结果
8.Quast评价组装的基因组效果
quast.py contigs.fasta -o quast_out
结果
打开report.html