在分析高通量测序数据的时候,我们会对Q20/Q30不陌生。那么Q20/Q30是什么意思呢?又是怎么来的呢?
Q20,Q30它们代表的是某一碱基质量值占全部碱基数的百分比,就类似于产品合格率,不同的质量标准会产生不同的合格率,标准越高,质量越好,达标的就越少;合格率越高,那么达标的数据就越多。一般而言,当Q30>85%的时候,就说明数据质量合格。还有一个是GC含量,一般在50%——60%之间。
一个给定碱基的测序质量分值Q定义为下面的等式:
Q = -10log10(e)
其中,e为预计碱基检出不正确的概率。
Q分值较高表示出错的概率较小。
Q分值较低可能会导致相当大一部分的片段不可用,还可能导致假阳性的变异检出增加,以致得出不准确的结论。
测量分值与碱基检出精度的关系如下:
好吧,这一期我们就先讲到这,下期再见。