hifiasm下载地址
截止今天为止,hifiasm官网更到0.19.3版本(五天前更新!!!):https://github.com/chhylp123/hifiasm/releases
2022.11.18号:Hifiasm-0.16.1 (r375)升级到Hifiasm-0.17.4 (r455) beta,截止今天(2023.3.22)升级到Hifiasm-0.19.3-r572;更新2023.4.21升级到Hifiasm-0.19.5-r578,这半年期间保持高频率更新,主要更新是支持超长ONT数据组装,CCS+Utralong ONT混合组装。
组装效果
目前测试,小基因组contig版本简单基因组能够直接组装到染色体水平,CtN50比16版本翻了一倍,直接前几条Ct就是染色体,最终HiC数据可能只是验证一下是否是0 gap基因组(还在分析中),也就是说简单基因组的T2T版本可能都不用其他的补gap软件进行补gap了。
组装建议
目前测试一个小基因组,超长数据necat纠错和HiC数据组装等不同组合测试,最终测试的HiFi+Utralong_nocorrect+HiC数据组合表现较好,得到的contig数目少,基因组N50,最长的conitg序列更长,还是有较多质体或线粒体序列,建议人工比对去除,得到最终的contig基因组。例如shell:
#加hic组装
fa=ccs.fasta
ont=ont.fa
/share/nas1/pengzw/software/hifiasm-0.19.3/hifiasm -o hifiasm.asm -t40 --h1 H0001_good_1.fq.gz --h2 H0001_good_2.fq.gz --ul $ont $fa 2> assemble.log
#不加hic组装
fa=ccs.fasta
ont=ont.fa
/share/nas1/pengzw/software/hifiasm-0.19.3/hifiasm -o hifiasm.asm -t40 --ul $ont $fa 2> assemble.log
NCBI最新的质体或线粒体库:
https://ftp.ncbi.nlm.nih.gov/refseq/release/mitochondrion/'
https://ftp.ncbi.nlm.nih.gov/refseq/release/plastid/
其他
同样的数据,不同的组装软件差别其实挺大。目前,已发表这么多基因组,有的可能换换组装软件,提升质量不在话下,所以分分钟又一篇文章了~