分别是中国人群和东北亚人群的填充参考,测试了下,中国人群的参考注册还是相对友好的,没有像有些网站一样严格限制。东北亚的没有测试,两个数据库的特点都是包含了少数民族,研究朝鲜或蒙古族或其他民族的同学,研究的填充效果会更好,可以测试下!
CHN100K
哈工大王亚东教授团队发表的迄今最大规模的中国人群遗传变异图谱数据资源。从我国的13个样本库中总共收集到26326份样本。研究人员的选取标准为①在当地居住超过3年;②没有重大疾病;③没有精神障碍或丧失沟通能力。研究过程中有592份样本的数据质控不合格,所以最终结果只来自25734份样本的数据。这25734份的样本群体涵盖了中国七个地理区域的8个民族(汉族和回、满、藏、蒙古、朝鲜、白、彝族)。
http://bioinformatics.hit.edu.cn/chnpop/#/help
在线基因型填充工具(http://bioinformatics.hit.edu.cn/imputation/)
NARD
韩国团队做的东北亚参考数据库(NARD),包括来自韩国、蒙古、日本、中国和香港的1779个个体的全基因组测序数据。NARD提供了千人基因组项目第3阶段(1KGP3)中不存在的朝鲜族(n=850)和蒙古族(n=384)祖先的遗传多样性。我们将NARD和1KGP3的基因型组合并重新分阶段,构建了一组联合单倍型。该方法为东北亚人群建立了一个稳健的插补参考面板,与现有面板相比,该面板对罕见和低频变异的插补精度最高。NARD插补面板在:https://nard.macrogen.com/