- Finley AO, Banerjee S, Waldmann P, Ericsson T. Hierarchical spatial modeling of additive and dominance genetic variance for large spatial trial datasets. Biometrics. 2009;65:441–51.
摘要:本文通过在大空间参考试验数据集的背景下开发用于推断加性和显性遗传方差的空间过程模型,扩展了在数量遗传学中最近感兴趣的贝叶斯分级模型。然而,这种模型到大空间数据集的直接应用在计算上是不可行的,因为涉及估计的三次矩阵算法。在马尔可夫链蒙特卡罗(MCMC)背景中情况甚至更糟,其中这样的计算被执行几次迭代。在这里,我们讨论有助于消除这些障碍而不牺牲建模的丰富性的方法。对于遗传效应,我们演示了关系矩阵的初始谱分解如何消除在先前提出的MCMC方法中所需的昂贵的矩阵逆转。对于空间效应,我们概述了避开昂贵的矩阵分解的两种方法:第一个利用从Ornstein-Uhlenbeck过程的分析结果,产生计算上有效的三角形结构,而第二个通过投影其实现从原始模型导出修改的预测过程模型到较低维子空间,从而减少计算负担。我们阐述了使用具有加性,显性,遗传效应和各向异性空间残差的合成数据集以及来自在瑞典北部进行的苏格兰松(Pinus sylvestris L.)后代研究的大数据集的所提出的方法。我们的方法使我们能够对这个大型试验提供一个全面的分析,充分证明,除了有违线性模型的基本假设,忽略空间效应可导致向下偏倚的遗传力测量。
通过马尔可夫链蒙特卡罗(MCMC)方法实现的分层随机效应模型最近在数量遗传学中获得普及(参见例如Sorensen和Gianola,2002; Waldmann和Ericsson,2006,以及其中的参考文献)。已经提出了单组分single-component和阻塞吉布斯取样器blocked Gibbs samplers。然而,单分量采样器受到缓慢混合的困扰,并且阻塞采样器通常涉及矩阵分解,其复杂度随着MCMC算法每次迭代的观测值数目n(n)的增加而增加。这些计算密集型矩阵计算限制对小样本大小的推断,这可能导致不可靠的结果和不确定的证据。
数量遗传学研究多基因性状的遗传,重点是估计加性遗传方差,σ2a和遗传力h2 =σ2a /σ2Tot,其中分母代表遗传和未解释的总变异。高遗传力应导致更大的选择响应,即在后代中遗传获得的概率更高。遗传变异可以进一步分成添加和非添加成分(Lynch和Walsh,1998)。给定一个感兴趣的多基因变量和个体谱系信息以及附带关系的实验设计,混合效应模型可以提供所有遗传变异的推断(Henderson,1985),因为加性,显性和上位性遗传效应在处于连锁平衡未选择的、非近交种群体中是不相关的(Cockerham,1954)。给定显性遗传方差σ2d,显性ra-tio,d2 =σ2d/σ2Tot,经常被估计,但目前缺乏直接的实际解释。
林业和农业栽培遗传试验的共同特征是观察单位之间存在系统性异质性。如果在模型中忽略这种空间异质性,遗传参数的估计可能会有偏差(Dutkowski et al。,2002; Cappa and Cantet,2007)。对于空间排列的观测单元,异质性通常源自小规模环境条件(例如,土壤特性,微气候,光可用性等),这可能导致单位之间的相关性作为距离和/或方向的函数。尽管传统的随机设计试图消除任何混杂的空间相关性,但是最近的兴趣转向了解释空间相关性的模型,最常见的是通过差分或通过使用来自相邻单元的残差构造协变量来合并空间相关性(参见例如, Zimmerman和Harville,1991; Cullis等,1998,及其中的参考文献)。
一个值得注意的例外是Zimmerman和Harville(1991),他们探索了在其模型中包括空间协方差的古典地理统计方法。我们也采用地理统计方法,但着重于设置,其中位置数量太大,无法有效估计层次空间模型。我们提供计算高效的方法给在基于个体的线性混合模型中包含或不包含空间随机效应的贝叶斯估计遗传方差分量。对于遗传效应,我们采用关系矩阵的谱分解来估计先前提出的MCMC采样器中所需的昂贵的矩阵求逆。我们限制自己到加性和显性效应,以避免通过上位性效应引起的可识别性问题。
对于空间效应,我们探讨两种方法来规避昂贵的矩阵分解。第一种是从产生稀疏三角形结构的特殊相关函数的产物构造空间过程。 Martin(1990)研究了基于可能性的方法的这种方法;在这里,我们将其适应于具有丢失数据的分层贝叶斯框架。我们的第二种方法不太熟悉,特别是在遗传试验中:我们应用驻留在具有较低计算负担的较低维子空间中的预测过程模型(Banerjee等人,2008)。预测过程的原始公式的缺点是它在模型的非空间误差项中引入正偏差。为了解决这个缺点,我们提出了一个修改的预测过程,有效地消除这种偏见。在第2节中,我们开发了数据模型,并详细介绍了帮助模型选择的方法。在第3节中,我们概述了拟议的MCMC采样器和讨论遗传和空间效应的实现。综合数据分析和苏格兰松分析在第4部分中介绍。在Web附录B中,我们在Scots pine试验站点的一个子集上提出的空间模型之间提供额外的比较分析。在第5节中,我们简要讨论了文章。