Hunt CH, Smith AB, Jordan DR, Cullis BR (2013) Predicting Additive and Non-additive Genetic Effects from Trials Where Traits Are Affected by Interplot Competition. J Agric Biol Environ Stat 18:53–63. doi: 10.1007/s13253-012-0117-7
预测其中性状受插图间竞争影响的试验的添加和非加性遗传效应
在植物育种程序中有两种关键的选择类型,即选择用于潜在商业用途的杂交体和选择用于未来育种的亲本。 Oakey et al。 (在理论和Applied Genetics 113,809-819,2006中)显示了如何使用混合模型分析中的谱系信息来实现这两个目的,以便将遗传效应分配为附加效应和非附加效应。 他们的方法是针对空间变异的现场试验数据开发的。 在本文中,我们扩展了数据从试验到插槽竞争的方法。 我们展示如何使用该方法获得纯立场添加剂和非添加剂效应的预测。 我们使用澳大利亚高粱育种计划的一个例子,在单一田间试验的背景下开发方法。
1.引言
广泛认识到,由于田间地块的空间位置,植物育种试验的数据常常表现出空间变化。聚焦于控制空间变化的基于模型的分析已经显示出对选择的响应导致显着的增益。大多数当前的空间方法涉及使用相关模型的趋势的直接建模,基本前提是更靠近在一起的绘图比更远离的绘图更类似(更高度相关)。一种这样的方法是Gilmour,Cullis和Verbyla(1997),其已经成功地用于分析来自澳大利亚谷物育种计划的谷物产量数据多年。然而,这些模型不适用于存在小区间竞争的试验中测量的性状。澳大利亚这种类型的一个重要例子是高粱繁殖试验的产量。 Hunt和Jordan(2009年)对36个这类试验的高粱产量(吨/公顷t / ha)进行了检查,发现三分之一的这些试验的间隙竞争的证据。他们建议,对于这种类型的数据,可以适应小区间竞争和空间趋势的联合建模方法是可取的。
Stringer(2006)讨论了用于联合建模插图竞争和生育趋势的一些方法。在这些方法之一中,使用Besag和Kempton(1986)治疗干扰模型(TIM)的随机效应模拟来模拟插图竞争。在该模型中,假定个体品种具有直接效应(在其生长的图上)和邻近效应(在相邻图上)。在随机效应设置中,这些被认为是(相关的)遗传效应,使得竞争在遗传水平上建模。 Stringer(2006)分析了许多早期甘蔗试验,发现随机效应治疗干扰模型(R-TIM)(或其降低的等级版本)在许多情况下提供了与数据的良好拟合。就杂交产量性能而言,感兴趣的关键性状是纯的产量,即来自不被不同遗传背景的杂种包围的杂种的产量。这种性状的混合效应的预测容易从R-TIM作为直接和邻居效应的预测的简单线性组合获得。
在澳大利亚高粱育种计划中,目的主要是为商业公司开发新的(完全育种的)亲本品系,以在其杂交育种计划中使用。 Oakey et al。 (2006)证明,通过并入血统信息的统计分析最好地满足这一目标。 Oakey et al。 (2006)提出了一个现场试验数据的混合模型,其中使用附加关系矩阵将遗传效应划分为附加和非附加成分,同时使用Gilmour,Cullis和Verbyla(1997)的空间技术同时建模误差变化。在本文中,我们提出了在Oakey等人的方法的扩展。 (2006),其结合了R-TIM以适应时隙竞争。所得模型能够将纯支架遗传效应分配为添加剂和非添加剂组分。在这里我们考虑单个试验的分析。在其他地方将考虑分析多个试验的扩展。
论文安排如下。首先我们介绍一个激励的例子(第2节)。在第3节中,我们提出了一系列统计模型用于单个现场试验的分析。我们开始一个基线分析,然后建立一个包含血统信息的分析,并适应空间变化和时空竞争。这些方法应用于实例的结果在第4节中给出。
2.移动实施例
我们的激励榜样取自昆士兰农业,渔业和林业高粱育种计划。这个程序运行类似于两个独立的家谱育种计划,一个是女性父母,一个是男性父母。在这些程序内的所有田间评价使用两个谱系程序之间的组合的F1杂种进行。我们认为2008年在昆士兰州沃里克市的冬宫研究站进行试验。该试验是男性的初步产量试验(PYTM)。
试验包含791个F1杂交体,包括783个测试杂交体,其是单个未释放的雌性和783个雄性亲本品系之间的杂交的结果,六个商业F1杂交体两个检查,是接近释放的F1杂种。试验的实验设计是可分辨的p-rep设计(Cullis,Smith和Coombes 2006)。测试和检查F1杂交体在试验中的一个或两个地块中播种,而大多数商业F1杂交体具有额外的复制。
高粱育种程序在矩形矩阵阵列中进行试验,其中我们通过两个因子(即行和列)来指数图。地块为1.5×10米,包括两个植被行。作为行相邻的图(即,在同一列内)共享最长绘图边界。毛发的普遍性需要包括喷射排,以允许进入喷雾机械。这些喷射行在试验中以规则的间隔发生,每10行成对出现。因此,行(11,12),(23,24),...,(12n-1,12n)(其中n取决于试验中的行的总数)将是喷出行。我们考虑的PYTM试验包括64行和20列。对于所有列,可分解块被对齐,使得块1占据行1至31,块2占据行32至64。由于在方框2中出现额外的喷射行,所以块的尺寸不同。
遗传设计由目的确定。 PYTM试验的目的是选择大约10%的F4男性亲本系以促进高级试验。 PYTM试验代表了产量选择的第一次机会,因此育种者对家庭和个体表现都感兴趣。共有783名F4男性与一名女性交叉。 783 F4男性分布在48个全同胞家庭。每个家庭的品系数从1到70不等,平均为17.4。除了来自试验的表型数据之外,在1778个系上有谱系信息,包括61个创始者系(即具有未知父母的系)。 F1杂种的平均近交系数为0.07,范围从0到0.24,而祖先系的平均近交系数为0.985。设计中的遗传连通性高,F1杂交体之间的平均加性相关性为0.499。谱系信息的可用性是下面分析的基础。
3.2。 包括信息
(3.1)的扩展以包括血统信息已经在Oakey等人 (2006)的单一试验和Oakey et al。 (2007),Beeck et al。 (2010)和Cullis等 (2010)的多环境试验。 这些论文充分描述了遗传方差分为添加剂和非添加剂部分。 该方法已被广泛使用,参见例如Burgueno等人 (2007),de los Crossa et al。 (2010),Piepho et al。 (2008)等。
在下文中,我们简要概述了由Oakey等人描述的模型。 (2006)和Oakey et al。 (2007),但扩展他们的模型明确地解释了(总)遗传效应的向量分为两个子向量。
4.结果和讨论
表1提供了拟合到PYTM试验的模型序列的概述。我们的分析开始于根据Gilmour,Cullis和Verbyla(1997)推荐的方法拟合基线模型,最近由Stefanova,Smith和Cullis(2009)修改。该模型包括对添加和非添加遗传效应的直接(D)效应,以及一个用于遵守设计的可解性的块项,并且最后对残差使用可分离的一阶自回归方差模型。
PYTM试验的基线空间分析得到表2中给出的模型1的估计方差参数。行维度的负自相关(-0.11)表示存在间隙竞争(Stringer和Cullis 2002)。用于检查假定空间模型的充分性的标准工具是样本变量图Gilmour,Cullis和Verbyla(1997)的图表。为了集中在竞争的效果,我们将我们的注意力限制在对应于零列分离的变差函数的切片。这在图1中给出,对于高达15的行分离。在空间趋势的情况下(即,利用正自相关),该图应该平滑地增加到平稳。然而,图1(a)中行间距为1的大尖峰意味着相邻的图(一行相隔)具有比进一步分开的那些更高的半方差。这表明相邻地块对彼此有负面影响。
图1(图(a)和(d))给出了由Stefanova,Smith和Cullis(2009)提出的诊断图。这些是表1中来自模型1的残差的经验半变差函数的样本值的行和列面。这些图利用经验表面的面的平均和95%逐点覆盖间隔来增加从Stefanova,Smith和Cullis(2009)中充分描述了这个过程,本质上使用当前方差分量模拟100次当前模型,并且计算样本变差函数每个模拟。获得2.5%和97.5%的百分位数,并包括在图1中。参数自举样本的平均行和列表面与来自模型1的残差之间存在明显的和系统的差异。在两个图所有滞后的平均值通常更高。这表示存在行和列效应。模型2通过包括行和列的随机效应来研究这种可能性。与模型1相比,模型2的残余对数似然性显着增加。模型2(a)和2(b)分别丢弃行和列项,以正式测试这些项的需要。使用残差最大似然比测试(REMLRT),这两个项被认为是显着的(p <0.05)。图1(图(b)和(e))给出了来自模型2的残差的诊断图。在经验半变差函数的行和列面之间通常与参数引导样品的平均值具有良好的一致性。
这些图的值得注意的特征是在经验半变差函数的行面处存在尖锐的“尖峰”。模型2的行自相关参数的REML估计是-0.18。这表明在这个方向上存在竞争(即,在相同列内的相邻图之间,共享共同的长边界)。用于对这种(明显的)竞争进行建模的方法是将R-TIM的降低等级版本适配于两者术语,由RR(D,N)表示。
模型3提供了对模型2的拟合的实质性改进,其中非添加剂和添加剂竞争被认为是显着的(使用REMLRT分别针对模型3a和3b与模型3)。
来自模型3的残差的经验半变差函数的诊断图是令人满意的(图1中的图(c)和(f))。注意,这些图的水平相当明显地从先前的模型(图(b)和(e))降低,反映了由竞争效应解释的变化量,这也反映在σ2的减少2)。还要注意,经验半变差函数的行面中的大尖峰已被去除。该模型的行自相关参数的REML估计为0.12,与模型2(表2)的-0.18相比。
图2给出了来自模型3的纯支架产率(u-ad + 2u-an)与模型2的直接效应的E-BLUP的经验BLUPS(E-BLUP)的前10%的曲线 F4男性父母。 显示在右上图中的简单相关系数显示来自这两个模型的E-BLUP的前10%的相关性为0.56。 这表明从每个模型中选择的男性父母明显不同,事实上,两个模型的前10%的E-BLUP只有77%的男性父母是共同的。 此外,纯立场效应的E-BLUP在幅度上显着小于直接效应的E-BLUP。 这是由于直接和邻近效应之间的负关系。