作者:刘绵宇
前言
这篇作为一个学习的开端,希望能养成一个多记的习惯,也希望可以激励自己多去学习。
传统的动物育种是基于两类数据,即系谱数据和表型数据。据此许多连续性性状取得了显著的遗传进展,但对一些低遗传力性状来说则进展缓慢。
2001年,由Meuwissen等人提出利用覆盖全基因组的标记估计育种值,利用该方法,估计每个标记的遗传效应,然后累加用来预测每个动物的总体育种值。在参考群体内估计标记的效应,然后利用这些效应,对具有标记基因型信息但没有表型的候选个体进行选择,但这种方法要想产生好的效果,要求基因分型的个体数量足够多,且基因组上的密度高,随着近期测序技术的发展,家畜和作物全基因组水平的多态性不断被阐明,高通量的SNP分型使得基因组选择在实际的育种过程中成为可能。
1.一些基本概念
基因座:基因在染色体上多占的位置,分子水平是具有遗传效应的DNA序列。两个位于同一个染色体上的基因座称为彼此连锁。
遗传标记:当我们比较同一个物种的两个个体的染色体上的碱基序列时,可发现大多数的碱基对是相同的,但是没有两个个体的碱基序列是完全相同的,在某些位点上,不同个体间的DNA序列会出现差异,这些位点就可用作遗传标记,称为分子标记或DNA标记。
SNP:单核苷酸多态,指在单个核苷酸上的突变所引发的多态,它只有两个等位基因,虽然在单个SNP上的多态性不高,但在基因组中的SNP数量很大。
QTL:数量性状基因座,即基因组的区域,其负责性状的遗传方差的一部分。
世代间隔:子代出生时其父母的平均年龄。
1.2 名词表
BLUP 最佳线性无偏预测
GBLUP 基因组最佳线性无偏预测
ssGBLUP 一步基因组最佳线性无偏预测
SNP-BLUP 最佳线性的SNP效应无偏预测
EBV 估计育种值
GEBV 基因组估计育种值
GS 基因组选择
GWAS 全基因组关联分析
LD 连锁不平衡
WGS 全基因组序列
2.奶牛基因组选育的成功
在基因组时代之前,传统的奶牛育种是依赖于后裔测定进行种公牛的遗传评估,即通过对每头公牛分散在多个畜群中的一百多个女儿进行性状测定来选择最好的公牛。
随着牛基因组草图的完成,SNP芯片产生并应用于当时已进行后裔测试的公牛进行基因分型。利用这些最初的参考群体,基因组的育种值以足够准确可以取代后裔测试。
在2009年,多个国家对年轻公牛只进行基因组评估,并允许传播它们的精液。这是一种革命性的选择:后裔测定不再需要,简化了选择过程并降低了成本,年遗传增益大大提高,无论是那种家畜,每年的遗传增益取决于四个参数:性状的遗传变异,选择强度,育种值估计准确性和世代间隔。如下式:
基因组选择可提高育种值估计准确性及压缩世代间隔,从而大大提高年遗传发展。不需要后裔测试选择就可以提前开展,刚出生甚至在胚胎就可以。同时一个物种是否需要开展基因组选择,取决于在可以在多大程度上减少世代间隔,但我也认为其提高育种值估计精确性也有重要的意义。
同时为了提高育种值的准确性,需要构建大的参考群体,因此在育种合作社之间开始了国际合作,产生了大型合作组织,为了降低分型成本,设计了一种低密度芯片,具有非常好的基因填充性,可以很好的预测缺失的标记。这就产生了一个良性的循环:大量已分型的个体降低了分型的成本,分型的个体进一步的增加。