在生成raw vcf后,进行SNP和indel提取,便于后续分析。
GATK4——gVCF转VCF - 简书 (jianshu.com)
输入文件:
- 参考基因组
- vcf文件
1. 提取SNP
$ gatk SelectVariants \
-R ~/ref/Mparg_v2.0.fa \
-V LPF1_MP.vcf.gz \
-selectType SNP \
-o LPF1_MP_raw_snps.vcf
报错:A USER ERROR has occurred: -selectType is not a recognized option
查了一下资料,不同版本的gatk提取SNP和indel的命令不同。
各版本GATK的说明书,大家可以根据自己的GATK的版本查看命令:
https://gatk.broadinstitute.org/hc/en-us/categories/360002369672-Tool-Index
修改如下:
$ gatk SelectVariants \
-R ~/ref/Mparg_v2.0.fa \
-V LPF1_MP.vcf.gz \
--select-type-to-include SNP \
-O PF1_MP_raw_snps.vcf
2. 提取indel
$ gatk SelectVariants \
-R ~/ref/Mparg_v2.0.fa \
-V LPF1_MP.vcf.gz \
--select-type-to-include INDEL \
-O LPF1_MP_raw_indel.vcf
参考材料:
https://gatk.broadinstitute.org/hc/en-us/articles/4404604678299-SelectVariants
引用转载请注明出处,如有错误敬请指出。