Cros D, Sánchez L, Cochard B, et al (2014) Estimation of genealogical coancestry in plant species using a pedigree reconstruction algorithm and application to an oil palm breeding population. Theor Appl Genet 127:981–994. doi: 10.1007/s00122-014-2273-3
关键信息:通过模拟退火显性谱系重建提供了植物物种中的系谱共生的可靠估计,特别是当自交率低于0.6,使用实际数量的标记。家谱共生信息在植物育种中至关重要,可以估计遗传参数和育种价值。 Fernández和Toro(Mol Ecol 15:1657-1667,2006)从分子数据通过谱系重建估计谱系结构的方法仅限于具有单独性别的物种。在这项研究中,它扩展到植物,允许雌雄同体和单性,可能的自我。此外,还考虑了人口统计历史方面的一些改进。新方法使用模拟和实际数据集验证。模拟表明,30个微卫星的估计精度很高,自交率低于0.6的结果最好。在这些条件下,真实和估计的家谱共生之间的均方根误差(RMSE)很小(<0.07),尽管祖先的数量被高估,自交率可能有偏差。模拟还显示标记之间的连锁不平衡和从创始人群体的Hardy-Weinberg平衡的偏离不影响该方法的效率。实际油棕榈数据证实了模拟结果,真实和估计的家谱共生(> 0.9)和低RMSE(<0.08)之间高的相关性使用38标记。该方法适用于熟食数据稀缺的熟食油棕榈种群。使用100个标记,估计的族谱库与使用分子系数的高度相关(> 0.9)。重建的系谱用于估计有效群体大小。总而言之,这种方法给出了可靠的系谱结构估计。该策略在软件MOLCOANC 3.0中实现。
介绍
对植物种群中个体之间遗传关系的了解对育种具有重要意义,因为它允许估计遗传参数(遗传和遗传相关性),育种值和有效群体大小。此外,需要这种信息来通过控制全球共同体来减少近亲繁殖和多样性损失的增加。这些值通常从家谱信息获得。然而,植物物种的育种种群的系谱可能完全或至少部分地由于各种原因是未知的。许多植物物种的育种包括不受控制的开放授粉或用花粉混合物控制的聚合,例如进行开放授粉或多交后代测试,如在饲料作物和林木中。缺失的谱系信息也可能是由于存在用于记录谱系的截止日期(即,谱系记录不是从不相关的创始者个体开始)和长育种周期。此外,育种程序包括许多易出错的步骤,包括授粉,种子准备,发芽,种植等。即使对于明确鉴定的亲本之间的受控杂交,也可能发生错误,导致幼虫后代(一个或两个亲本实际上未知)或污染(一些非法的个人在进程中)。这已经报道了很多次,例如在甘蔗(McIntyre和Jackson 2001),油棕(Corley 2005),道格拉斯冷杉和火炬松(Adams等1988)。此外,未知来源的个体可以进入育种群体,例如当来自另一育种程序时。
完全缺少谱系信息,小深度谱系或错误的谱系对育种程序有负面影响,通常是由于遗传参数和育种价值的错误估计。在diallel进程试验中,爱立信(1999)显示,0.5%的树种具有错误的谱系,足以向下偏移加性方差和遗传力估计。 Atkin等人(2009)发现,当在分析中使用更多谱系信息时,加性方差分量和育种值的准确度提高。在多克隆后代测试中,男性父母的未知相对贡献可能是有害的(Kumar等人2007),并且重建雄性亲本增加遗传获得(Doerksen和Herbinger 2010)。此外,假设新进入育种群体的个体与主要种群无关,如果实际存在共同的祖先来源,可能导致错误的管理决策。因此,对于具有对植物物种的繁殖种群的系谱的良好了解具有实质性的兴趣。特别是,这将导致对家谱共生的可靠估计,从而导致更好的育种管理。 Fernández和Toro(2006)提出了一种方法(FT方法),通过构建明确的虚拟谱系来估计当代基因型个体之间的家谱共生。通过模拟退火算法(Kirkpatrick等人,1983),FT找到产生具有相对于实际分子共同体矩阵或任何其他提供的相关性矩阵的最高相关性的家谱共谱矩阵的谱系。换句话说,FT将给定当前群体内的分子coancestries匹配到最可能的兼容系谱。几个参数有助于减少参数解决方案的空间,并找到更接近真正的人类的解决方案,如以前离散代的数量重建,最大数量的公牛和水坝在前几代,如果可用的话,已知的部分的血统。 FT相对于其他方法的优点(参见Blouin 2003; Butler等人2004; Pemberton 2008 for reviews)是其不需要知道基本群体中的真正等位基因频率(即,来自其中的基因型个体派生),并且基底群体中的Hardy-Weinberg和连锁平衡不是必需的。此外,它可以管理个人之间的相关性的任何程度的复杂性,并始终提供一致的关系,导致积极确定的基于谱系的coancestry矩阵。这项研究的目标是首先扩大FT方法的能力,以使其适合植物物种,其次,演示这些新的能力与模拟和真正的植物种群。 FT被开发用于雌雄异株,即具有单独性别的物种,特别是动物。因此,在FT的模拟血统中作为节点的任何虚拟祖先是男性或女性,不能同时存在。因此,自交,这在许多植物物种和它们的繁殖的工具是可能的是不可能的。我们将FT方法扩展到包括单系和雌雄同体,具有自交的可能性(即混合交配,其中一部分后代来自自体受精,剩余部分来自异交),当混合交配是自然重现模式,或者因为这是人为强迫繁殖的目的。具有自交的第一代是用户定义的参数,因此解释了在特定时间进入可以人工进行自体受精的育种程序的自然交叉受精物种的可能性。 FT方法的另一个限制是虚拟群体的大小在世代之间是恒定的。为了考虑人口统计历史的知识,我们使FT能够通过世代考虑可变数量的祖先。从相关创始人开始的可能性也被实施,因为它有助于获得更适合真实数据的解决方案。为了演示新方法的能力(之后的FT *),我们使用来自两个油棕(Elaeis guineensis)繁殖群体的混合交配物种和实际数据的模拟数据。关于模拟数据,我们评估了不同自交率,未知父母百分比和标记数量对方法的准确性的影响,以及偏离Hardy-Weinberg和连锁平衡的理想情况的影响。实际数据涉及Yangambi(非洲)和Deli(亚洲)油棕种群,目前正在进行重要的育种工作。 Yangamb人群用于验证FT *,因为血统是众所周知的创始人个人。对于Deli种群,谱系数据稀少,我们使用这个种群来说明利用FT *进行系谱重建的一个关键应用,通过由Gutiérrez等人开发的方法估计基于谱系的有效群体大小(Ne) 。 (2008,2009)和Cervantes et al。 (2011)。 Ne是油棕中感兴趣的参数,没有可用的估计值。这种物种是“暂时雌雄异育的”,在同一植物上的交替周期中产生雄性和雌性花序,导致同种异体繁殖模式。因此,自然不会发生在自然,但它已经被育种者在其系谱的某一点使用。因此,人为自交事件的程度的推断对于当前的繁殖群体管理是重要的。将重建系谱获得的Ne值与通过Hill(1981)和Waples(2006)方法获得的Ne值进行比较,该方法仅基于链接不平衡和独立于谱系数据。