当下的农业生产中,每年都会遭受来自生物或非生物胁迫带来的损失。想要挽回损失,进行作物抗性育种,就迫切需要理解植物对于外界胁迫的响应。植物细胞内NLR蛋白是一类识别病原微生物效应因子的受体,对植物免疫病原物起着至关重要的作用。然而NLR蛋白在单双子叶植物中数量和种类分布差异巨大,例如单子叶NLR蛋白中TNL的缺失。更有趣的是,NLR信号下游的成分NDR1和EDS1-PAD4-SAG101复合物不仅能参与免疫通路,还能够调控非生物胁迫。那么NLR蛋白是否可以介导生物和非生物胁迫串扰呢? 本文从比较基因组学和系统发育学给出了答案。
文章信息
- 题目:Convergent Loss of an EDS1/PAD4 Signaling Pathway in Several Plant Lineages Reveals Co-evolved Components of Plant Immunity and Drought Response
- 期刊和时间:The Plant Cell,2020.7
- 作者和单位:通讯作者来自加州大学伯克利分校Ksenia V. Krasileva副教授。
主要结果
- 利用比较基因组学检索了被子植物NLR蛋白的拷贝数变异和多样性。
- 检索了上述植物中EDS1/PAD4通路关键蛋白的分布。
- 利用基因家族聚类方法预测了与EDS1/PAD4通路关键蛋白共进化的NLR蛋白。
研究结果
1.有花植物的NLR拷贝数变异巨大
作者首先利用公共数据库(Phytozome,COGE,KEGG,NCBI,Maize GDB,Ash Tree)获取到95个被子植物基因组并且调查了它们的NLR拷贝数(Fig1)。注释文件显示大部分已测序的基因组具有200-500个NLR。作者在各个科中根据其NLR多样性和基因组组装质量,选择了18个单双子叶的代表物种并绘制了全基因组物种系统发育树(Fig2)。
在两张图中,作者使用了Amborellales基因组的NLR数量作为单双子叶的对照。无油樟目(Amborellales)是被子植物的一个目,仅含无油樟科(Amborellaceae)一个科。APG IV系统认为无油樟目是被子植物基部群的三个目之一,也是被子植物的最早期分支。在后面的系统发育树中也起到了外群的作用。
注解:Fig2是18个代表物种的全基因组系统发育树。枝上标注了NLR基因获得(黑色数字)和缺失数(红色数字)。这两个数字通过系统发育树协调(Tree Reconciliation)方法计算得出,更多有关信息可以参考这篇文章:Phylogenetic Tree Reconciliation: Mean Values for Fixed Gene Trees。该方法可用于计算基因进化史和物种进化史的不一致程度,从而计算基因的获得数和缺失数。系统发育树拉丁名后面的两个数分别是用PfamScan和plant_rgenes预测的(括号里的)带有关键motif的NLR数量。
在物种水平查看了NLR基因的收缩和扩张之后,作者着手关注单一NLR在各个物种中的分布。同时具有六种功能motif的NLR蛋白的NB-ARC域被选择构建系统发育树(Fig3)。作者单独放大了TNL和RNL枝(蓝色框和红色框)。同时作者给出了系统发育树中基因扩张的例子(灰色框),可见某一物种如果在某一进化枝中大量富集,这种模式出现在系统发育树中就是串联重复基因扩张。 以此为据,作者发现NRG1集中出现在TNL扩张的群体中,因为TNL依赖NRG1传递信号。S.polyrhiza, Z. marina, and U. gibba三种物种中有很高比例的NLR蛋白以单系种特异群形式出现,也就是说在这三个物种中一个NLR蛋白形成的进化枝中同一个物种不会出现两次。而其中S.polyrhiza, Z. marina也发现了部分串联重复基因扩张的例子,说明尽管二者跟其他物种相比丢失了一些基因,但是剩余的基因仍然再进行种内扩张。
2.免疫信号EDS1/PAD4/SAG101在被子植物的丢失
利用tblastn和blastp方法,作者继续探究了免疫信号下游组分的出现与否(Fig4是95个物种的信号分布情况)。有意思的一点,U. gibba物种在刚刚我们见识到了它NLR基因丧失的很严重,种内串联重复扩张也没有。但是其SA通路仍然保留,说明了SA通路在植物免疫中的重要地位。丢啥也不能丢SA(这部分信息在Supplemental Table 4)。
Fig4中出现的几个免疫信号下游组分,都是研究中经常出现的热点。新手小伙伴可以自行查阅:
RPM1 INTERACTING PROTEIN 4 (RIN4)
MAP KINASE 4 (MPK4)
ISOCHORISMATE SYNTHASE 1 (ICS1)
METACASPASE 4/ 5 (MCP4/5)
REQUIRED FOR MLA12 RESISTANCE 1 (RAR1)
同时作者发现在一些没有RNL和TNL的物种中,EDS1/PAD4/SAG101免疫组分也有丢失。因此作者扩大范围,回到原有的95个物种中调查EDS1/PAD4/SAG101免疫组分的丢失情况(Fig4)。同样发现在NLR蛋白少的物种中免疫组分EDS1/PAD4/SAG101和RNL会丢失,这些免疫组分不仅是蛋白互作物,也是进化单元。
丢失基因的遗传区域结构对于理解基因何时丢失以及如何丢失非常重要,因此作者对A. comosus 和S.polyrhiza染色体区域的EDS1,PAD4和ADR1及其他同源基因进行了同线性分析(Fig5)。结果发现PAD4 和ADR1都能找到物种间的通线性区域,而EDS1找不到该区域。基因丢失可能是删除所导致的。
3.正交同源蛋白家族分析寻找趋同丢失的基因
NLR基因和EDS1/PAD4/SAG101的趋同丢失使作者联想到可能存在其他趋同丢失的基因,那么应该如何找到这些趋同丢失的基因呢?因此作者测定了18个代表物种的蛋白质组并进行了正交组分析(Orthogroup Analysis)。正交组分析依靠两个关键手段:OrthoMCL分析和GeneSeqToFamily分析,从而将蛋白质聚类到正交组,完成基因丢失的归类。
通过结合单子叶和双子叶OrthoMCL分析(Fig6),作者在4个丢失EDS1、PAD4和RNL基因的物种中鉴定出了17个缺少同源类群的拟南芥基因。 GeneSeqToFamily使作者从10个正交群中候选出31个拟南芥基因。两种方法取交集从而确定了四种基因,前三种就是刚刚发现的EDS1,PAD4,ADR1(RNL)。还有一种REGULATOR OF CHROMOSOME CONDENSATION 1- LIKE(RCC1-like)是之前没有发现的蛋白。 进一步作者检索了两个方法中任意一个检测出来的蛋白,在EDS1缺失物种中一共找到了51个候选蛋白,并将其命名为ASTREL。
4.拟南芥和水稻中ASTREL基因应对生物和非生物胁迫时的差异应答
为了了解ASTREL基因是否在生物胁迫或其他途径中存在差异表达,作者寻找了ASTREL共表达模式。通过mRNaseq和microarray技术进行抗性扰动实验,结果发现生物胁迫和非生物胁迫(干旱)对ASTREL表达有不同的调控方式。生物胁迫和非生物胁迫可影响ASTREL基因的共表达。
总结:
本文是一篇针对基因组和同源蛋白家族分析的纯生信文章,其中正交组实验用来寻找趋同丢失基因让人耳目一新,或许可以借鉴到未来的研究中。此外,文章的立意十分有趣,结合了生物和非生物抗性讲出了一个有意思的故事,是比较基因组,系统发育和基因趋同进化领域一个可借鉴的研究模板。
1. Erin L. Baggs, J. Grey Monroe, Anil S. Thanki, Ruby O’Grady, Christian Schudoma, Wilfried Haerty, Ksenia V. Krasileva, Convergent Loss of an EDS1/PAD4 Signaling Pathway in Several Plant Lineages Reveals Coevolved Components of Plant Immunity and Drought Response, The Plant Cell, Volume 32, Issue 7, July 2020, Pages 2158–2177, https://doi.org/10.1105/tpc.19.00903
2. Górecki, P., Markin, A., Mykowiecka, A., Paszek, J., Eulenstein, O. (2017). Phylogenetic Tree Reconciliation: Mean Values for Fixed Gene Trees. In: Cai, Z., Daescu, O., Li, M. (eds) Bioinformatics Research and Applications. ISBRA 2017. Lecture Notes in Computer Science(), vol 10330. Springer, Cham. https://doi.org/10.1007/978-3-319-59575-7_21