Korecký 2013 标记结合谱系估算遗传参数

Korecký J, Klápště J, Lstibůrek M, Kobliha J, Nelson CD, El-Kassaby YA. Comparison of genetic parameters from marker-based relationship, sibship, and combined models in Scots pine multi-site open-pollinated tests. Tree Genet. Genomes. 2013;9:1227–35.

摘要

使用9个微卫星DNA标记（简单序列重复，SSR）来估计597个苏木（松树）树之间的成对关系，以及产生用于定量遗传参数估计比较的同胞结构。研究树是102代第一代父母的开放传粉后代测试的一部分。使用三种方法来估计方差分量和遗传度，即结构谱系（半和全同胞），基于标记的成对关系（四个成对估计量）以及组合的谱系和基于标记的关系。在三种方法中的每一种中，使用相同的动物模型来计算方差，除非使用基于标记的关系，其中我们用基于标记的成对关系计算的平均分子关系矩阵（即，基于谱系的矩阵）代替。我们的结果显示谱系（全同胞）和组合标记 - 谱系估计之间的估计育种值具有高度相关性。当分析单个地点数据时，基于标记的关系方法产生高相关性。相比之下，基于标记的关系方法导致方差估计和其标准误差的显着减少，这与早期公布的结果一致;然而，当尝试进行跨站点分析时，没有产生估计值。我们的结论是，组合谱系方法是最好的方法，因为它代表了被测试个体之间的历史（成对）和当代（谱系）关系，这种情况不能通过任何使用的方法单独获得。这种方法取决于所用标记的数量和信息。

前言

大多数树木改良周期选择方案包括传统的活动顺序，即选择，育种和测试，导致鉴定进一步育种的精英基因型，并将其纳入生产种群（Namkoong et al。，1988; White等人2007）。例如，在捷克共和国，通过建立几个第一代种子园开始苏格兰松（Pinus sylvestris L.）育种程序，随后是来自种子园生产的开放授粉后代的后代测试（Kaňák等人。2009）。原始计划是在半同胞模型假设之后评估所有开放授粉的进化，并选择一组父母以纳入受控交配方案以用于进一步的先进世代选择。这个策略因两个原因发生改变。首先，在开放授粉后代试验的数据分析阶段，必须援引几个重要的假设，即父母是不相关的和非自交的，开放传粉的家庭的成员等同于由大量父本繁殖而来的半同胞家庭，和缺乏自交。众所周知，这些假设不能满足，因此估计的加性遗传方差可能大量膨胀，导致正树的错误排序（见下文和Squillace 1974; Namkoong等人1988; Askew和El-Kassaby 1994 ）。第二个原因是利用一种新的方法在定量遗传数据分析，其中使用分子标记的成对关系在单株之间估计遗传参数（Visscher等人2006）。
Porth et al。（2013）利用基于标记的关系将未知（来源测试）的试验转换为用于估计遗传参数（如遗传相关性）的完全测试。此外，Bömcke和Gengler（2009）在一个分析中介绍了结合分子标记的关系和谱系的概念。组合的分子标记 - 谱系模型是非常有效的，因为组合DNA指纹数据有助于提供与当代完整和/或不完整的亲本/谱系知识的共同祖先的历史信息。这种方法是独一无二的，因为历史同居和当代谱系的组合不能通过基于科学或基于标记的关系方法单独实现。因此，我们期望遗传参数的准确性从（1）开放授粉到半和全同胞家族逐渐增加到（2）基于标记的关系估计到（3）那些组合遗传标记的关系和谱系信息。如果使用大量基因座，这种情况应该改变，并且基于标记的关系应当超过所有列出的方法。值得注意的是，在结构化谱系中经常忽略的孟德尔采样项是使用分子标记精确地解释的。
在本文中，我们比较遗传方差组件，包括遗传力和从使用9个（SSRs）生成的兄弟组成（谱系）产生的个体的育种价值估计，基于分子标记的成对关系，以及谱系和标记信息。比较这三种方法，可以提供评估捷克共和国苏格兰松后代试验的最佳方法，并帮助选择第二代育种周期的精英基因型以及建立先进世代的生产种群（种子园）。

方法

系谱法

除了每个幼苗的半同胞指定外，我们使用COLONY程序（Jones和Wang 2010）根据补充1中观察到的关系构建样品树的完全谱系，并且使用COLONY程序输出每棵树确定的后验父本似然以及为后续的同胞分析而组装的全同胞家系。我们假定在后代一代没有自交，因为苏格兰松以其高的超越率≈0.987±0.005而着称（Burczyk 1998）。

基于标记的关系方法

使用四个成对分子关系系数估计方法来产生所有可能的基于成对标记的关系矩阵用于随后的定量遗传分析（Li等人1993; Lynch和Ritland 1999; Queller和Goodnight 1989; Wang 2002 ）。使用SPAGeDi v 1.3软件（Hardy和Vekemans 2002）估计成对关系矩阵。所使用的四个成对关系方法的细节在它们各自的参考文献和Bink等人的工作中描述。（2008）了解更多详情。用于产生所有可能的估计量的基于成对标记的关系矩阵（Li等人1993; Lynch和Ritland 1999; Queller和Goodnight 1989; Wang 2002）用于替换定量遗传分析中的平均分子关系矩阵（见下文）。

结合谱系和基于标记的关系方法

来自同胞分析的系谱记录（即全同胞信息）和分子标记关系用于估计结合两种信息来源的修正关系（Bömcke和Gengler，2009）。简而言之，组合关系估计被计算为基于加权的基于血统和基于标记的相关性。权重基于生成当量（geq）的数量，其对于每个个体计算为（1/2）^n的和，其中n是将个体与每个已知祖先分开的世代数（Huby等人。2003）。基于谱系的关系根据Wright等人（1925）关系系数。分子相关性估计如下：

讨论

在世界各地，传统的森林树木养殖历史上依赖于开放授粉（OP）测试计划，因为其极为简单。简单地说，为了评估所选择的亲本的遗传价值（育种价值），可以从期望的亲本（加上树）收集风力传粉的种子，并建立半同胞子代试验，其中特定父母的育种值被计算为平均值后代与群体平均值的偏差（Falconer和Mackay 1996）。应当理解，OP测试方案（低成本，后勤方便）的实际优点与显着的局限性相关：（1）偏离了“真实”的女性父母与所有男性父母在人口中的交配，在选择标准中的配偶之间具有相等的亲代表示和接近零的相关性），（2）不可能评价非加性基因作用（在感兴趣的性状内和之间）的影响，和（3）不同的家庭（不同的母亲）不一定保证不存在半同胞相关性或其他类型的相关性，例如第一代表亲或甚至自交（White et al。2007）。从本研究获得的过度膨胀的加性遗传方差和遗传性估计进一步支持这一概念并强调与该方法相关的注意事项。然而，应该说明的是，如果OP测试被认为是粗糙劣质基因型的过滤器，则可以使用全同胞（即，结构谱系）或分子标记成对关系方法精确测定所选个体的真正遗传优点。分子标记的发展，加上重建谱系的统计方法，使得可能将传统简单OP测试的优点与更先进的全同胞家族匹配方案的优点相结合。因此，掺入遗传标记的OP测试方案成为传统的基于结构 - 谱系（半 - 和全同胞杂交）育种的竞争平台（参见El-Kassaby和Lstibuchrek 2009; El-Kassaby等人2011用于理论定量）。

动物模型被开发以促进经典育种，但最近，广义混合模型框架，结合使用分子标记，在进化遗传学中发现了巨大的优势（Kruuk 2004）。它们可以最佳地适应可变家族大小（通常在开放家族测试中发现），并组合来自多个位置和代的数据;此外，考虑非随机交配和选择的影响。由于这些原因，动物模型为谱系重建方法提供了更好的平台，而不是基于简化假设的简单半同胞评估。经典动物模型将预期关系（谱系）矩阵中的连通性的优点与在分析中替代谱系的相关性矩阵相结合。 Frentiu et al。（2008）报告说，这种方法使用减少秩关系矩阵，导致更好的遗传变异估计;然而，**估计协方差仍然是一个具有挑战性的任务。

在我们的调查中，我们结合使用基于谱系的相关性（A矩阵）与基于标记的关系（G矩阵）（Bömcke和Gengler 2009）。这是为了最小化可变父代表示对基于标记的关系的影响，该关系仅基于9个SSR。前面提出，当通过各自的相加遗传值评估时，这样的组合分析导致个体的可靠排序（Blonk等人，2010）。基于我们的结果，全同胞和组合分析之间的高相关系数证实了它们的推理，因为组合分析包含来自全同胞的重要信息。另一方面，本研究中使用的四个基于标记的估计量导致加性方差估计和它们各自的标准误差显着降低。这符合Frentiu等人早期的发现。（2008），他们讨论了使用基于标记的方法时的两个主要挑战，包括（1）种群内相关性的内在变异性和（2）我们有效采样/检测这些模式的能力**。此外，本研究中实施的选择程序可能减少（即向下估计）以前由Rodriguez-Ramilo等人观察到的基于标记的可行性估计。（2007）。鉴于此，我们调查了所有相关性类别（即不相关和半和全同胞）中基于标记的成对关系的分布，并将它们与组合谱系标记关系估计器的分布进行比较（图1 ）。组合估计器清楚地产生三个不同的无关和半和全同胞类，而四个基于标记的估计产生一致和令人惊讶的结果显示半和全同胞的平均值降低（图1）。此外，这种比较还产生了组合和基于标记的方法分别与对照的估计方差与减少与宽方差（图1）。这可能是所使用的标记的数量和infomativeness以及父母的贡献不平衡的反映。我们怀疑观察到相关性类之间缺乏区别是导致我们无法估计多个位点使用时的加性遗传方差的原因表2）。应当清楚地指出，在数据分析之前实施的预选择（即，将分析限于来自实验的个体的子集）限制了我们获取“完整”方差的能力，并且可能影响家族方差估计。然而，这样做是为了最大化遗传进展选择的父母将其包括在第二代种子园。

基于标记的方法的主要益处是其对整个人口历史进行采样的能力，因为其不受已知谱系限制，并且基于IBD可能性简化了相关性的概率描述。由于没有参考水平来比较基于谱系和基于标记的估计，它们的成对比较不是完全公平的（Oliehock等人2006）。此外，应该强调的是，在本研究中，基于标记的方法不等同于它们的基于系谱的（全同胞）对照部分。优势遗传方差的计算只能通过确定需要大量标记的博爱系数来估计（Lynch和Ritland 1999）。因此，我们认为在本研究中使用的分子标记的数目（其为9）不允许正确地构建兄弟系数的精确构建;因此，我们选择避免估计基于标记的方法的优势遗传方差。因此，我们将重建的谱系与基于成对标记的关系组合以克服缺点。

从育种的角度来看，基于标记的方法如果精确地进行，应该被认为有利于经典评估方案，因为它们使育种者免于建立结构化谱系的任务，并且直接允许遗传评价而不考虑谱系。同时，需要更多的研究来涵盖历史人口结构（例如IBD与IBS：Powell等人2010）的影响，标记的类型，数量和信息量以及样本大小。最后，必须澄清的是，通过谱系重建揭示的所得到的后代结构仅仅是参与交配的亲本数目，它们各自的繁殖物理学和产量以及污染水平（基因流）的函数。在发生高基因流动的情况下，由同胞分析产生的谱系锚定在母体亲本周围，并且不影响估计的母体遗传参数的质量。

Korecký 2013 标记 结合谱系 估算遗传参数

摘要

前言

方法

系谱法

基于标记的关系方法

结合谱系和基于标记的关系方法

讨论

推荐阅读更多精彩内容

Korecký 2013 标记结合谱系估算遗传参数