Isik FT, Holland J, Maltecca C (2016) Genetic Data Analysis for Plant and Animal Breeding.
第7章:空间分析
概要
在本章中,我们描述了在事后分析中处理异常的异质性的空间分析,而不是在实验设计中。 这些空间分析可以通过更准确地模拟田间试验中误差效应的空间分布来改善遗传效应的估计。 当模型对于固定和随机效应不同时,选择最佳模型可能是复杂的。
背景
通常的最小二乘方差分析的假设是误差效应独立地分布在实验单元之间。这个假设在许多动物育种和遗传学研究中是合理的,其中动物本身是实验单位,并且能够移动,限制其环境中的空间趋势的影响。然而,这种假设可能不适用于植物或树木育种中的许多田间实验。如果可能,植物育种者选择均匀的田间位点进行实验,但由于土壤类型,生育力,持水能力等方面的差异,一些田地可能表现出高水平的异质性。随着实验条目的数量变得更大,将实验区域分成均匀实验单元的块的能力变得更加困难。当每个实验条目的单个图可以拟合到几个均质块中的每一个中时,随机完全块是优异的实验设计,但随着测试基因型的数量变大,这变得越来越困难。
不完全的块设计,如格子(Cochran和Cox,1957)和alpha设计(Patterson和Williams,1976)被开发以处理实验单元在完整块内不均匀的情况。不完全块设计在实验设计中引入不平衡,其可以通过混合模型分析来很好地处理,所述混合模型分析同时估计随机完全块和不完全块随着(随机或固定)处理效果的影响。当不完全块内的实验单元是均匀的时,不完全块设计将是非常有效的,但是不能保证在实地实验中的情况。不完全的块设计不可能捕获在具有未知空间趋势的领域中的实验单元的异质性(尽管一些趋势在种植之前可能是明显的,但是许多其他趋势在种植之后将不会出现;另外的空间趋势将仅在种植后出现,管理和数据收集)。
在本章中,我们考虑随机完全块和不完全块字段设计,并且还描述了在事后分析中而不是在实验设计中处理错误的异质性的空间分析。这些空间分析可以通过更准确地建模场中误差效应的空间分布来改进遗传效应的估计。
空间分析对田间数据分析的潜在改进不应被视为放弃良好实验设计原则的理由。事实上,我们建议在可能的情况下使用不完全块设计进行大型实验,并将传统的不完全块设计分析与空间分析进行比较,也许将两个分析的方面结合起来,以优化地模拟田间实验中的非遗传变异,作为改善估计测试材料的育种值。
建模空间效应
随机完全区块设计是通过拟合分析中块的主要效应来处理实验单元中的异质性的一种方法。不同复制中的图的平均程度不同,归因于块效应,并且由块效应解释的变化在模型本身中解释,因此与忽略块效应的分析相比,减少了残差误差方差。这也从误差估计中去除了r-1个自由度,这可以降低误差方差估计的精度,但是在大的实验中这种效应通常是可忽略的。不完全块设计进一步扩展了该概念,由于完全块中的不完全块的影响,以从残余物去除更多自由度,向实验设计引入不平衡和成对的不同水平的精度吸收额外的变化条目比较。行列α设计(John和Eccleston,1986)允许在行和列方向上进行阻塞,同时优化作为设计一部分的成对条目比较的精度的平衡。如果可能,我们建议使用这些不完全块设计用于大型实验,用于评估作物或树木的育种值或基因型值。
在某些情况下,出于实际原因,不可能使用行 - 列设计。例如,北卡罗来纳州立大学的玉米育种计划在几个实验研究站进行研究,这些研究站管理各种作物和研究项目的实验。字段在作物和项目之间旋转多年,并且用于规划的字段的身份通常直到设计实验以允许种子被计数并包装用于种植之后才知道。因此,α晶格通常用于实验设计,知道不完全的块将可能不表示场的矩形子部分。然而,它们仍然可以捕获场梯度的一部分,因此是有用的。此外,通过使用趋势分析(其将正交多项式变量拟合到行和列位置; Brownie等人,1993; Brownie和Gumpertz,1997),样条函数(Gilmour et al。 ,1997b),或者甚至通过简单地将行和列作为随机效应来拟合,如果具有足够的自由度和行和列之间的条目的充分重叠,则使用重复的检查变体(如在增补设计的各种形式(Federer和Raghavarao,1975)以系统或随机的方式(Müller等人,2010)帮助提供关于空间趋势的信息,并允许它们以这种方式建模;或者,可以将误差效应建模为由于最后,这些方法不是排他的,可以将模型中的行和列因子作为固定或随机效应,以及残差之间的模型相关性进行拟合。不完全块设计,空间分析和模型选择的组合可以大大提高品种选择试验的准确性(Qiao et al。,2004,2000)。当使用这些方法时的关键挑战是避免过拟合模型并且在许多各种可能性中选择最佳模型。