背景介绍
verkko是一个最新的可以应用于二倍体基因组T2T(telomere-to-telomere
)级别的基因组组装的组装软件。
2022年9月14号李恒在主题为PacBio HiFi数据组装及应用
的在线会议上提到过,“目前为止verkko可能是比hifiasm效果更佳的组装二倍体T2T基因组的软件。”
那它为什么这么厉害呢?
根据GitHub的介绍,verkko是一个混装PacBio HiFi和ONT数据的基因组组装软件,基于Canu的纠错模块将PacBio HiFi reads纠错后建立multiplex de Bruijn
图, 再将ONT序列对齐(align
)到图上,逐步解决循环和缠结的区域,最终用Canu的consensus模块得出最终结果。
所以,如果你想最大限度地发挥verkko的能力,首先你得有PacBio HiFi reads和ONT数据(也许还得是ultra long ONT才行)。
作为一个非常state-of-art
的软件,verkko当然也是支持在大型集群上运行的,不管是SGE
, Slurm
还是LSF
的作业系统它都是支持滴~ 另外,verkko还支持trio-based phasing
,不过要先用rukki
和merqury
这两个软件先处理后才能输入给verkko。
软件安装
让我们再次感谢conda的方便~
conda install -c conda-forge -c bioconda -c defaults verkko
软件运行
由于我只有PacBio HiFi数据,所以就跑个纯hifi的试试水
verkko -d /path/to/verkko \
--hifi test1.hifi_reads.fastq.gz \
test2.hifi_reads.fastq.gz \
test3.hifi_reads.fastq.gz \
--no-correction \
--no-nano \
--threads 20 \
--local \
--local-memory 100 \
--local-cpus 20
可用资源
bioRxiv文章:https://www.biorxiv.org/content/10.1101/2022.06.24.497523v1
GitHub地址:https://github.com/marbl/verkko
一个无用的小知识
Verkko is Finnish for net, mesh and graph.
Verkko在芬兰语中是网、网格和图形的意思。
私货时间
- 可以说verkko是一个所图甚大的基因组组装软件,是标准的
state-of-art technology
。 - 有钱真的可以为所欲为。