四个环境gtdbtk、pangenome、minigraph、drep、metawrap-env
gtdbtk可以对所有bin进行注释,可以看到bin属于什么物种
gtdbtk classify_wf --pplacer_cpus 30 --cpus 120 --genome_dir bins_all/ --full_tree -x fa --out_dir gtdbtk
minigraph中利用参考基因组,加上属于同一物种bin的集合,合成一个新的泛基因组
minigraph -xggs -t16 ref.fa sample1.fa sample2.fa > out.gfa
gfatools gfa2fa -s graph.gfa > out.stable.fa
pangenome对gtdbtk中注释为相同物种的bin进行合并形成泛基因组
panaroo -i gff/*.gff -t 40 -o strict_result --clean-mode strict
panaroo -i gff/*.gff -t 40 -o sensitive_result --clean-mode sensitive
drep可以发现有多少不重复的基因组
dRep dereplicate -comp 70 -con 50 <outdir> <inportdir( including all .fa)>
metawrap-env的checkm可以对生成的基因组进行评估
nohup checkm lineage_wf ./ ../checkm_4mox -t 30 --pplacer_threads 10 -x fa &