240 发简信
IP属地:山东
  • GenomicsDBImport 不应该划分过多的intervals,因为每分析一个interval,就会将所有的GVCF文件打开,检索一遍,在interval过多的时候,这个打开GVCF文件的过程会占用大部分时间。这个问题在GATK论坛上也有讨论。所以我觉得应该按染色体分intervals,对于组装不好,Scaffolds过多的基因组,最好舍弃一部分Scaffold或将小的Scaffold连在一起作为一个interval。

    GATK4 多个样本GenotypeGVCFs前用 CombineGVCFs还是GenomicsDBImport

    我们知道,GATK 4 多个样本joint genotyping用模块GenotypeGVCFs, 目前GenotypeGVCFs只支持以下三种形式的输入文件:1)a sin...