问题:为什么女性检测出了Y染色体突变?
原因说明(欢迎补充):
1,首先,性染色体上的很多reads比对质量一般较差,并且存在大片段同源区,可能会有许多错误比对到性染色上的reads。咱们目前使用的最新的基于b37的hs37d5参考基因组虽然会将Y染色体同源区标记为N,但是不能完全避免这种类似的问题,所以就算是女性,也可能存在一些低质量的reads比对到Y染色体(参考截图1)。从目前接触到的女性的染色体覆盖情况也可以看到,即使是女性,Y染色体的覆盖也并不是0,如果女性也是用了Y染色体上覆盖的信息进行变异检测,则可能检测到一些突变。
2,目前GATK官方仍然没有对于性染色体的建议,一般的best practice还是整个bam文件作为输入检测的,但是有提到如果有需求的话,对于女性一般的解决办法,是不去检测Y染色体突变,对应男性的一般解决办法,GATK 可以分开检测X,Y染色体,设置倍性为1(参考截图2,截图3,截图4)。
总结及解决办法:
综上,如果我们没有对男女进行区分检测,即女性没有避开Y染色体,则可能会出现女性有Y染色体突变的情况。目前的解决办法,samtools 或者 GATK分染色体,女性不检测Y染色体突变;
备注:以下截图及网址,均来自GATK官方论坛,以及broad或GATK相关开发人员的回复。
截图1:
https://gatkforums.broadinstitute.org/gatk/discussion/2895/vqsr-and-sex-chromosomes
截图2:
https://gatkforums.broadinstitute.org/gatk/discussion/comment/40962#Comment_40962
截图3:
https://gatkforums.broadinstitute.org/gatk/discussion/7937/sex-chromosome-in-vcf-calling
截图4:
https://gatkforums.broadinstitute.org/gatk/discussion/comment/51948#Comment_51948