Grattapaglia D, Plomion C, Kirst M, Sederoff RR (2009) Genomics of growth traits in forest trees. Curr Opin Plant Biol 12:148–156. doi: 10.1016/j.pbi.2008.12.008
树木的生长特征是森林生态系统适应和人造林生产力的基本要素。许多过程决定了树木生长,这些生长受到几个世纪以来对环境信号动态响应的遗传和表观遗传因子的控制。基因组学的进步使得对树木生长和适应的复杂机制的理解更加了解。然而,基因组学在提高森林生产力和可持续性方面的应用仍然需要捕获控制组分特征的总遗传变异的很大比例。然而,遗传学和基因组学是统一的学科,将有助于解剖树木生长发育的变数和机制。
引言
与草本植物相比,树木的一个显着特征是它们的巨大身材,由几十年到几个世纪的高度和径向二次生长推动。二次生长源自血管形成层,其由二次分生干细胞组成,其分化成树皮到外部(次级韧皮部)和木材到内部(次级木质部)。树的生长由细胞分裂和扩展在顶端和成像分生组织,发育和季节性生长转变,光合作用的效率,营养和水的摄取和运输,以及响应生物和非生物胁迫的能力决定。这些过程受到无数响应环境信号的遗传和表观遗传因素的控制。生长最终导致提供机械支持,防御机制和在广泛距离上易位水,溶质和信号分子的结构。
树木生长相关性状是天然林和人造林中生存和生产力的基本组成部分(专栏1)。生长到休眠过渡对温带和北方气候多年生植物的生存至关重要。光照或根生长对水表的快速高度增长是先驱物种的主要特征。从功利主义的角度来看,树木的增长是生产率的代名词。它代表了任何树木育种计划中强化木本生物质生产的首要目标特征,无论最终应用是结构木材,工程木制品,纸浆和造纸或能源。任何森林工业的可持续性取决于不断供应木材,最佳土地利用以及资本密集型作业中的规模效率。因此,了解树木生长将对改变环境中森林生存所需的适应性遗传变异的管理以及木材生产力遗传增益选择性育种的效率产生重大影响。
最近在理解植物生长发育的基本方面取得了巨大进展。已经描述了影响激素作用,转录控制和其他调节因子的基因套件,主要来自拟南芥拟南芥的研究[1]。大部分工作集中在枝条和根尖的初级分生组织,因为拟南芥几乎没有二次生长。虽然初级分生组织对所有植物的生长和发育是基本的,但次生分生组织对木材生产具有更大的意义。最近的评论强调了分子证据表明,参与木材形成的基因并不是树木独有的,而是顶端分生组织和血管形成层共享重叠的调节系统[2]。
在这次审查中,我们讨论了最近在基因组理解树木生长方面取得的进展,以及对森林生产力和可持续发展的潜在应用。将注意到五种互补方法,用于鉴定参与控制生长性状的基因组区域,基因或多态性树(方框1和表1)。桉树[4,5]的即将到来的基因组序列以及针叶树基因组序列的前景可以提高所有这些实验方法的步伐,特别是在光照下对生物质转化生物质燃料的重新兴趣[5]以及迅速发展的高通量测序和基因分型技术。
方框1影响树木生长和用于理解和操纵它们的基因组方法的主要特征。箭头表示基因组方法的方向,无论是基于性状(前向)还是基于基因(反向)。虽然QTL定位涉及到前向基因组学,但关联和群体基因组学在候选基因的基础上运作。所有其他方法都沿双向进行。例如,通过激活标记或反向沉默特定的候选基因,可以向前使用转基因来产生新的表型。全基因组选择使用表型来开发基因型预测模型,然后将其反向用于推断表型。
QTL定位:了解复杂生长相关性状的第一步
QTL定位是解剖复杂性状遗传基础的入门。这是一种无偏见的正向基因组学方法,其中表型显示调节基因或影响特征的基因组区域的位置。 QTL分析对于多因素性状如生长具有吸引力,其中候选基因的先验定义难以捉摸。最近一系列关于树木的QTL研究,以生长相关性状为主要目标[6,7,8,9,10,11,12]。生长可以精确测量,特别是在方差分析分析中考虑微环境影响的克隆复制试验中。它是育种计划的主要目标特征,特别是生物量生产,鉴于其遗传力低,育种者对标记辅助选择有最大希望的特征。用于树木生长的QTL定位依赖于RFLP,RAPD,AFLP和微卫星[13]。最近,高密度SNP图[14]和基于微阵列的标记,例如杨树的单特征多态性(SFP)[Drost D和Kirst M,未发表]和桉树的多样性数组技术(DArT)[Grattapaglia D和Kilian A,未发表]正在变得可用。
与作物种类不同,其中选择亲本系以最大限度地提高目标性状的差异,树木中的QTL定位已经进行了家系,父母通常是“良好的种植者”。然而,在所有主要种植树种中都检测到与生长相关的性状的QTL [13]。由于实验设计[15],效应的大小可能被高估了,因此,发现主要影响QTL的增长解释在表型变异的10%至30%之间,这是由于树木的高杂合性。遗传异质性可能是造成生长QTL位置和不相关家系的变化和与时间和环境变化的显着相互作用的影响的原因[6,7,12,16]。增长的QTL可能是由于不同种类的变化。我们倾向于认为增长的QTL反映出存在提高育种育种价值的等位基因。然而,增长的QTL可能会在群体中识别交叉中甚至是高频率的致死基因的分离性半致死基因[17]。
在QTL定位中,对于生长和生物量特征,特别是杨树的兴趣已被更新。可以跨越种系转移的微卫星的开发现在允许跨研究比较分析QTL的生长性状[6,7,12]。这种综合的QTL位置信息和一个有注释的基因组序列,有望确定强候选基因的生长。在测序基因组中QTL间隔内这些基因的鉴定在复杂性状的几个植物物种中已经成功[18]。随着新的基因分型技术的大型谱系和更高分辨率的测绘技术在森林中可用,QTL位置信息将越来越多地成为依赖于临时候选基因的关联遗传学的方法的有力替代方法。在杨树早期的测绘研究中,发现芽组织和芽冲洗的QTL与植物色素B2基因(phyB2)共位[19]。最近的一项关联遗传学研究发现植物色素B2基因中两个非同义SNP与芽组的时间变化相关[20]。
关联遗传学和群体基因组学:寻找控制森林树木生长的基因的有希望的方法
从人类,动物和作物遗传学中<u>获取</u>的森林树木中提出了关联或连锁不平衡(LD)映射范式[21]。它是在桉树[22]开创的,并应用于许多研究,因为测序信息已经可用[20,23,24?6]。该方法很快获得了兴趣,因为它可以很容易地应用于大型随机交配树种群,可能克服了林木中的物流和时间限制以及QTL定位的不良解决。由于LD有限,高核苷酸多样性和缺乏参考基因组序列,关联遗传学依赖于候选基因的SNP基因分型。已经报道了木材性状特征[22,24,25],芽物候学[20],抗病性[26]和耐旱性[23],间接影响生长的基因性状协会。然而,个体协会的影响程度很小,很少超过10%,即使是高遗传性状[26]。
除了仅扫描几百个基因的目前限制之外,树种的关联研究几乎完全探索了基因的编码区,而在很大程度上忽略了调节区。由于在森林自然种群中通常观察到的LD的快速衰减,改变基因表达的突变可能不会通过与编码区中的SNP的间接关联来检测,并且在候选基因方法中可能被忽略。对中高频等位基因的关注也排除了罕见的SNP变异的分析,难以用现有人群和统计学方法进行检测。与人类一样,这些罕见的等位基因中的一些可能是特别有意义的,因为它们可以产生极度的育种价值表型。通过使用只有几百个人的样本量,关联研究也不足,理论上不足以检测小效应的等位基因[27]。这些结果重申了迄今为止研究的性状的复杂性质,并进一步挑战了将候选基因应用于更复杂特征如体积增长的关联遗传学的期望。
随着增长是适应的基础,生长成分是确定天然树种群进化重要性基因的极好目标。人口基因组学将全基因组抽样与群体遗传整合,以了解进化过程。指导群体基因组学的两个主要原则:(1)跨基因组的中性基因座将同样受到人口统计学和人群进化史的影响; (2)选择的基因座通常会有不同的表现,并显示“异常”变异模式。大量随机交配的自然种群的森林树木,占据不同的环境,提供了独特的机会来确定适应性群体分化中涉及的多态性[28]。这种方法已经成功地检测了许多森林树木的变异对比模式的基因,包括橡树(Quercus sp。)[29],加拿大樟子松[30],海松(Pinus pinaster)[31]和白云杉(Picea glauca)[32]。然而,在杨树中,没有发现有遗传分化的遗传分化在物候候选基因中遗传分化的物候候选基因,以前已显示出明显的变异[33]。尽管人群基因组学可能代表了鉴定生长和适应性状态基因的有希望的方法,但仍然存在限制,特别是在候选基因的选择方面。存在与SNP发现相关的确定偏差,需要有关基因角色的功能信息来验证候选者。此外,具有较高的基因流量和空间变量选择?典型的森林?平均自适应性状的种群差异可能发生,尽管潜在QTL频率的变化很小[34],表明上位性相互作用,表观基因组学或转座因子的运动。
生长和发育的转录组学和遗传学基因组学随着树生长由顶端和成像分生组织细胞分裂和扩张而产生,这些区域的转录组一直是几项研究的重点。关于特定基因在树木发育和生长中的作用的综述已在其他地方出版[35]。从茎和其他营养组织的表达序列标签测序为几个商业相关树属中的树木生长的基因组了解奠定了基础[36,37,38,39]。随后的研究创建了形态生长的详细转录路线图,主要是在杨树中,其中在木质部分化期间存在明确的基因表达程序被证明[40]。分生组织中的基因表达程序显示与枝条和根尖分生组织具有很多相似之处[41]。还注意到吲哚乙酸(生长素)和赤霉素在山杨木地层中的作用,表明生长素浓度控制了一些关键调节剂的表达,从而激活了木材形成所必需的下游基因级联[42]。与亲本物种相比,在杨树F1杂交种中检测到基因表达的广泛等位基因特异性变异,其显示出强大的种子增长优势[43]。虽然该研究没有揭示具体的证据,F1杂种中改变的基因调控可能参与了不仅在山杨中也在其他几种树种中观察到的生长杂交表型。
转录组研究已经开始解决季节性变化期间的全球基因表达变化。少量的转录调控因子似乎控制这些季节性转变以及表观遗传修饰在休眠中的释放和释放[44,45]。杨树叶季节转录组的变化也显示出基因表达的显着变化[46]。在秋季衰老期间,许多转录组的变化与一年生植物中描述的相似,其中光合机械的降解伴随着蛋白酶的增加。衰老和调控其进展的基因可能在多年生植物和一年生植物之间基本保守,如其他基本生理过程如光合作用观察[47]。在针叶树中,主要关注的是理解从早春(春季)到晚夏夏季和秋季的季节变化的基因调控,其特征在于木材的化学和物理性质的变化。通过大型基因组调查[48]评估了这一转变,该基因组调查检测到两个基因表达簇和与Pinus pinaster中早木和晚叶形成相关的相似比例的基因。松树的其他研究侧重于沿着针叶树垂直轴的转录变异分析[49,50]。从顶端分生组织产生的次生形成层比从基底的成熟分生组织产生的更小,预期差异反映在前者细胞分裂和蛋白质合成中涉及的大量基因,而碳水化合物代谢和在后者中木质素过多。最近尝试确定被子植物和裸子植物之间的保守转录物。针叶树白云杉和拟南芥的比较分析发现一组31个转录本在两种物种的木质部中保存[51]。
长期以来,由于大量固定碳不可逆地流入苯丙素聚合物,生长和木质素含量之间可能存在负相关。转录组分析提供了对这一主要控制水平所涉及的机制的洞察[52]。许多基因在单螺旋藻生物合成途径中的表达与木质素含量和高丁腈基亚基组成呈负相关,与生长呈负相关。甲醛5-羟化酶(也称为阿魏酸5-羟化酶-F5H)的转录水平具有最高的相关性。这种酶是合成松柏醇和芥子醇的分支点,它是木质素的两个主要前体。高表达与较慢的生长,较高的木质素和高S / G(丁香酰/愈创木酚木质素亚单位)的比例相关。表达QTL(eQTL)分析表明,几个交互因子(尚未鉴定)同时调控单信号通路中的许多基因[52,53]。似乎是碳水化合物代谢和细胞分裂的代谢控制,调节碳流入芳香族氨基酸生物合成和次级壁的碳水化合物,或增加细胞分裂。
发现生长基因的转基因方法鉴定负责生长和生物量生产的基因的替代策略是产生抑制或激活靶基因并筛选其表型的突变体。使用插入突变来创建突变体表型的基因标记方法非常适合于树木[54]。当过表达基因是主导的时,表型可能在初级转化体中可见,因此在收集在树中需要几年的第二代后代之前可以检测到。激活标记杨树中的试点种群[55,56]使得能够研究强等位基因。由于强烈的纯化选择,这些变体在天然种群中将是罕见的。筛选与木本多年生植物相关的发育异常已经确定了影响叶片大小和结构,茎发育,芽冲洗时间,次生代谢和叶片衰老的基因[54,56]。为这些特征鉴定的候选基因座包括含有DELLA结构域的GRAS基因家族成员,其可能调节GA应答。 Busov等人标记了一种调节树状状态的赤霉素分解代谢基因(GA 2-Oxidase)。基因/增强子捕获已经鉴定了参与血管发育和木材形成的基因[58]。结合QTL和关联研究,对全基因组插入突变种群的分析将成为当种群筛选广泛表型时与生物量生产相关的基因发现的有力工具。
用于生长的基于基因组的育种:从表型解剖到森林中的全基因组选择
尽管森林中关联遗传学的理论和实践的最新进展,单一基因 - 性状关联发现可能不足以影响育种复杂的特征,如森林树木的生长,除非它可以捕获大部分的个体和群体之间的生长表型变化。在此之前,定量遗传学方法可能会更有效率。在针叶树中,正在努力增加采样到数千个基因的数量,将基因组学转化为育种应用[26]。然而,由于大型育种群体的LD范围偏低,所以存在挑战。复杂性状中多少表型变异是由编码区而不是由调控元件直接控制的,仍有待确定。在谷物中,远处(> 10?0 kbp)顺式作用调控区域的非编码多态性已被证明是整个育种和进化过程中植物适应的重要组成部分[59]。类似的机制可能对森林树很常见。
人们普遍认为,在以林木为基础的基因组育种之前,必须对复杂的特征进行剖析[26]。在增长的情况下,还有其他几个数量性状,“解剖法”在合理的时间内不会有效推进林木繁殖。相反,全基因组,预测,“黑盒子”的方法,排除QTL的信息,并重点关注目标性状的遗传改良,具有更大的应用概率。称为全基因组或基因组选择(GS)的这种方法可以被定义为覆盖整个基因组的数千个标记的同时选择,使得预期所有基因与至少一些标记物处于连锁不平衡[ 60]。然而,最近,随着基因分型成本的下降,GS变得可行,引起了作物[61]和多年生植物[62]育种者的关注。需要基因组和成本效益高的标记系统将GS应用于森林。此外,必须采用有效人口大小(Ne)约20?0个人的专业GS育种种群,以增加LD的程度,并适应目前可实现的每摩根数百个标记的基因分型密度[63],因为LD是一个功能的4Nec,其中c是两个标记之间的重组分数。在遗传异质性林木中,这些种群仍然包含大量遗传变异,用于持续的遗传增益。与老鼠相比,最近的实验结果表明,GS具有比传统的多基因模型更好的预测能力[64]。在桉树中正在测试GS方案,其中基于高密度基因分型和数百个发现群体克隆(训练集)的精确表型开发多个性状的预测方程,涉及Ne在15〜50范围内。然后在验证群体中评估预测模型的选择准确性,针对后代试验中针对个体树木级别的早期GS的应用[Resende MDV和Grattapaglia D,未发表]。
结论和观点
生长的一些方面已经在基因组水平上相对较好地描述,特别是木本植物独特的成像分生组织及其衍生物。养分和水分吸收,运输或光合能力等因素的贡献仍有待更好的了解。木材形成的基因组控制大多从广义的角度来看,忽略了木本被子植物和裸子植物之间的主要差异。针叶树和木本被子植物的基因组自3亿多年前分离后可能会有显着的演变。有助于生长变化的许多遗传和表观遗传因素可能不同。被子植物经常经历基因组重复,为基因新功能化和专业化创造机会。然而,针叶树基因组似乎在同一时间具有保守的倍性[65],尽管更多的转座子活性与较大的基因组大小相关。表观遗传学机制如基因组甲基化已被证明在某些针叶树种群的衰老过程中发生了显着的变化[66],并可能在其发育中发挥突出作用。这种差异可能指导未来基因和基因组对生长和发育的了解。
在人类中,基因拷贝数变异和表观遗传因子被越来越多地视为表型多样性的主要贡献者,特别是对于疾病易感性。在植物中,有助于生长发育的最重要的遗传变异来源尚不清楚。在林木中,我们只是开始看单核苷酸多态性水平的变异。物种内部和物种之间的结构和表观遗传变异,仍然是森林中尚未开发的领域,可能揭示出控制生长性状的关键因素,并且可能直接涉及到在杨树和桉树F1种间杂交种中发现的强壮杂种优势。正在进行的几个杨属基因型(Tuskan J,个人通信)的重新排序以及与桉树即将出现的参考基因组相似的可能性应该能够更好地了解遗传多样性的来源,从而可能揭示基于基因组的新方法来种植树木改善和可持续增长。