计算成对的Fst值后的无偏估计-di统计量(di statistic)
2010年,Joshua M. Akey在文章“Tracking footprints of artificial selection in the dog genome | PNAS”中提出通过简单的汇总统计来测量每个品种等位基因频率的位点特异性差异
1.首先计算出每个SNP位点的Fst值
2.对每个SNP位点的Fst值进行计算划分窗口的di统计量。
-
计算每个SNP的di统计量
,其中
和
表示从所有21,114个SNP计算出的品种i和j之间的FST的期望值和标准差。 对于每个品种,在非重叠1 mb窗口的snp上取di平均值。每个窗口的平均snp数为9.5,snp数小于4个的窗口被丢弃。
在R中使用“lm”函数进行标准线性回归,以调整SNP标记数量和平均杂合度的di的窗口特异性估计值,并发现它对结果没有显著影响(P >0.05)。
文献:Genomic Signatures Reveal New Evidences for Selection of Important Traits in Domestic Cattle | Molecular Biology and Evolution | Oxford Academic (oup.com)
根据对成对FST的无偏估计,即di,如前所述,测量了每个品种等位基因频率的位点特异性差异(Akey et al. 2010)简而言之,对于581,820个SNP中的每一个,我们计算了品种i和j之间FST的预期值和SD。对于每个品种,在50个SNP的非重叠窗口中包含的SNP上对di进行了平均。牛的基因组中共有11,651个窗口。下游分析使用了平均di得分最高的前1%(117)或5%(583)区域。
参考:[1] Tracking footprints of artificial selection in the dog genome | PNAS
[2] Genomic Signatures Reveal New Evidences for Selection of Important Traits in Domestic Cattle | Molecular Biology and Evolution | Oxford Academic (oup.com)
[3] Genome-wide scan reveals genetic divergence and diverse adaptive selection in Chinese local cattle | BMC Genomics | Full Text (biomedcentral.com)