《Cell》非洲肺鱼基因组揭示了脊椎动物从水到陆地的转变
作者:王坤,1,17王军,2,3,17朱成龙,1,4,17杨连东,5,17任艳东,1,4,17阮珏,6,17范广义,7,8,17胡江,9,17徐文杰,1毕旭鹏,8朱友安,10宋越,7陈华涛,11马甜甜,11赵若平,4蒋海峰,5张斌,12冯晨光,1袁媛1甘晓妮,5李永新,1曾宏辉,5刘群,7张耀磊,7邵峰,13郝世杰,7张贺,7徐迅,8刘鑫,7王德鹏,9朱敏,10张国杰,8,4,14,15赵文明,12,*邱强,1,*何顺平,5,14,16,*和王文4,14,18,19
简要
介绍了大规模非洲肺鱼基因组的基因组组装和分析,揭示了从水到陆地的转变所需的遗传
创新
1. 迄今为止报道的最大脊椎动物基因组的染色体水平组装
2. 转座子的持续扩展促成了巨大的肺鱼基因组
3. 遗传变化增强了呼吸、运动和抗焦虑能力
4. 从硬骨鱼到肺鱼,再到四足动物经历了三个遗传创新步骤
总结
肺鱼是现存的四足动物的近亲,并保留了与水向陆地过渡有关的祖先特征。 然而,它们巨大的基因组规模阻碍了对进化中这一关键转变的理解。在此,我们报道了非洲肺鱼(Protopterus annectens)基因组的40GB染色体水平的组装,这是迄今为止报道的最大的基因组组装,其重叠群和染色体N50分别为1.60 MB和2.81 GB. 肺鱼基因组的大尺寸主要是由于反转录转座子。具有超长长度的基因表现出与其他基因相似的表达水平,表明肺鱼已经进化出高转录效率以保持基因表达平衡。结合转录组和实验数据,我们鉴定了与陆地适应性状相关的潜在基因和调控元件,如肺表面活性物质、抗焦虑能力、五指肢和咽部重塑。我们的研究结果为理解从鱼类到人类的进化途径提供了见解和关键资源。
介绍
古生代地球大气中氧气含量的持续增加为陆生动物的出现创造了条件(Hsia et al,2013)。 在硬骨鱼类的祖先首次表现出呼吸空气的能力之后(Bi et al,2021;Liem,1988),四足动物的祖先成功迁移到陆地上。脊椎动物从水到陆地的转变需要一系列身体创新的进化(Ashleyross等人,2013) 呼吸、感觉、运动、循环和其他系统必须被改造以适应陆地(Long和Gordon,2004)。 近几十年来,古生物学研究逐步阐明了脊椎动物出现在陆地上的过程(Clack,2012)。作为一种重要的补充方法,对四足动物及其现存姐妹谱系的比较基因组学研究将为揭示其转变过程和潜在的分子机制提供关键视角。四足动物在四足鱼类中筑巢,四足鱼类是现存的三种肉鳍鱼类(叶鳍鱼)谱系之一,还包括腔棘鱼和肺鱼(Lu et al,2012)。 肺鱼作为四足动物的近亲,突出了留在水中的叶鳍鱼的祖先状态(Amemiya et al,2013),代表了理解这些转变的遗传基础和进化过程的桥梁。然而,肺鱼基因组的巨大尺寸,从40-130千兆碱基(GB)(Metcalfe et al,2012),在相关研究中提出了巨大的挑战。在这项研究中,我们成功地获得了非洲肺鱼(Protopterus annectens)的40GB染色体水平的基因组组装,具有高度的完整性和连续性,并进行了系统分析,从基因组序列、跨越大多数组织的表达谱,到一些基因和调控元件的实验验证,以探索4.2亿年前(Ma)从水到陆地的进化遗传过程(Zhu et al,2009)。
结果
染色体水平组装
根据短读长序列的KMER分析(图S1A)和流式细胞术(图S1B),非洲肺鱼基因组的大小估计约为40GB。 我们对长读长序列进行测序,(503次覆盖,N50读数长度28.48kb)使用牛津纳米孔测序技术(ONT)(图S1c;表S1)。 结合短读序列测序、光学图谱和Hi-C技术,我们得到了17条染色体的染色体集合(图S1D),范围从862Mb到5.28 GB和12640个未放置的小支架(总共126 MB).组件的最终长度为40.05 GB,N50为2.8 GB(表1). 组装染色体的数目和长度与肺鱼核型一致(图S1E)(Suzuki和Yamanaka,1988). 超过97.3%和95.2%的基因组区域可分别被长读数和短读数覆盖20倍(图S1F) 此外,对于短对读数,96.6%可以正确配对,表明装配的连续性较高.然后使用硬骨鱼类中总共178个超保守元件(UCEs)来评估组装的完整性,171个(96.07%)可以与组件对齐.通过比较,169和158可以与腔棘鱼(Amemiya et al,2013)和美西螈(Nowoshilow et al,2018)基因组进行比对.
我们进一步对来自两个个体的14个样本的120GB的PacBio全长cDNA数据和227GB的短读RNA测序(RNA-Seq)数据进行测序,并将它们组装成转录本数据集,包括分别来自全长和短读RNA-seq的150Kilo和4.1百万转录本(表S1)。 基于转录本数据集和脊椎动物的同源蛋白质,我们在基因组中鉴定了19,457个蛋白质编码基因,包含95.4%脊椎动物中完全保守直向同源物和Busco分析(表1)(Seppey等人,2019),四足动物中92.0%的完全保守直向同源物. 肺鱼和腔棘鱼/美西螈/青蛙之间相似的基因数量和KS分布(图S1g;表S2)表明,除了祖先脊椎动物共有的两轮WGD外,最近没有发生全基因组复制(WGD),转座因子(TES)的扩增可能是导致非洲肺鱼基因组大小较大的主导力量,我们将在下文中说明. 然后,我们在肺鱼和西方爪蛙之间鉴定了11,837个1:1直向同源基因(Hellsten et al,2010),其具有高质量的染色体水平基因组组装,以检查两个物种之间的染色体关系. 共线性图显示,两个物种的同源染色体片段可以清楚地识别(图1A)。
从8个脊椎动物物种的5,149个1:1直向同源基因重建的系统发育关系证实,肺鱼是与四足动物最接近的姐妹谱系(图1B)。 尽管串联基因树的Bootstrap值得到了100%的支持,但在单基因树的拓扑结构中存在广泛的异质性(图S1h),这表明在叶鳍动物的早期分化过程中存在一定程度的不完全谱系分类.肺鱼和四足动物的分歧时间估计为419Ma(图1b),大约是泥盆纪的开始。通过对近期人口历史的推断,我们发现这种非洲肺鱼的数量在1Ma左右经历了快速下降(图1C),这与之前的一项研究一致,该研究报告了南非林波波流域在过去1Ma的长期干旱化,该流域是非洲肺鱼的重要栖息地(Caley等人,2018)。 我们还对另一个肺鱼个体进行了重新测序,并验证了人口动力学结果.
基因组扩增
肺鱼基因组的扩增主要是由TES的增殖引起的。 共61.7%的肺鱼基因组被注释为重复序列,代表24.7 GB(图2a).大约15GB的整个基因组被注释为既没有功能也没有重复序列. 这些区域最有可能代表一次古老的转座爆发,随后是长时间的退化,产生大量独特的序列,即所谓的“ TES墓地”(Sirijovski et al,2005)。 最丰富的TE类型是长散在核元素(LINEs,11.5GB),长末端重复序列(LTR,7.7GB)和DNA转座子(3.7 GB)。 其中,LINE/CR1(7.8 GB)和LTR/DIR(6.1GB)是构成最高比例的两个子类. 然后,我们通过分析Kimura距离(Chalopin et al,2015)估计了历史上的TE扩展活动,结果表明TE,特别是反转录转座子,在过去7000万年(MYR)内一直活跃(图S2a)。 这些工商业污水附加费的近期活动占 9GB,峰值扩增速率为433Mb/MYR,表明非洲肺鱼的基因组大小在过去的100MYR中逐渐增加,这与以前的工作一致,表明细胞大小在显生宙逐渐增加(Thomson,1972)。
TES的持续插入可能对基因组内容和基因调控产生影响。 非洲肺鱼的平均和中值内含子长度非常长,并且几乎16GB的基因组是内含子区域 肺鱼的最长基因为18Mb,比美西螈(6的基因长得多。 7MB)和人类(2 5 MB)。 人类基因组中只有91个长度超过1Mb的基因,但肺鱼中有5000多个。 相反,肺鱼和其他脊椎动物的平均外显子数和外显子长度相似,非洲肺鱼的物种特异性基因家族扩展与其他脊椎动物相似(表S2)。 通过对转录组数据的检测,我们发现基因表达水平与基因长度之间没有明显的相关性;即使长度大于1Mb的基因也表现出与其他较短基因相似的表达水平(图S2b)。 我们还发现,与其他物种相比,基因长度的变化对非洲肺鱼的基因表达没有任何大的影响(图S2c)。 这些结果表明,为了保持基因表达平衡,肺鱼中超长基因的转录效率可能有所提高。
非洲肺鱼的TE含量与美西螈的情况非常不同,美西螈的基因组大小为32GB(图2A)。 一致地,它们的域内容也是不同的(图S2d). 当我们仔细观察HOXA基因簇的不同基因之间的距离时,很明显,基因间/内含子延伸在非洲肺鱼和美西螈中是独立发生的,因为它们是由不同类型的TES增殖引起的(图2B)。 这些观察结果与先前的比较系统发育分析一致,表明它们的基因组大小是独立增加的(Organ et al,2016)。 尽管非洲肺鱼和美西螈具有独立的基因组扩增,但它们都具有大量的RVT_1结构域(图2C),编码逆转录酶,该酶总是由反转录转座子携带. 在266种脊椎动物中,RVT-1的数量与基因组大小呈正相关(表S3),在非洲肺鱼中有超过5.2百万个,而在小鼠中只有61631个,这意味着反转录转座子是基因组扩增的主要驱动力。这些RVT_1结构域被发现广泛分布在整个非洲肺鱼基因组中(图S2e),这意味着积累过程已经持续了很长时间。
然后,我们通过检查直向同源基因的内含子长度来研究跨物种的基因组扩展。 首先,我们观察到肺鱼基因内含子长度的增加与RVT_1结构域的数量呈线性相关(图2D),反映了反转录转座子在基因组扩增中的重要作用。 其次,我们观察到非洲肺鱼内含子长度的增加与美西螈直向同源基因的增加呈正相关(图2e),表明较长的内含子积累了更多的TES。 一致地,我们观察到内含子长度的增量与初始内含子长度之间的正相关性(图2F)。 然而,具有较长初始内含子长度的基因倾向于具有较小的扩展率(图2g),尽管它们的绝对增量较大(图2F),这表明对基因长度的极端扩展的选择。
先前的研究提出,红皇后假说可以解释TE活性与抑制策略之间的关系(Bruno et al,2019;麦克劳林和马利克,2017年;Rogers等人,2018年)。 基于PFAM-A数据库(El-Gebali et al,2019),我们在40种脊椎动物中检测到16,826个结构域。 其中,只有54个结构域的数量与基因组大小呈显著正相关(表S4)。 在非洲肺鱼的54个领域中,有12个领域的数量超过1000。 12个结构域中有7个与TES相关,3个是锌指蛋白结构域,1个是纤丝结构域,1个是KRAB结构域。 有趣的是,KRAB结构域和其中一个锌指蛋白结构域(ZF-C2H2)一起形成了Kruppel相关的盒式锌指蛋白,其已被证明在胚胎干细胞中转座因子的沉默中发挥重要作用(Imbeault et al,2017)。 此外,在分析的266种脊椎动物中,肺鱼具有最高数量的KRAB结构域(图2C;表S3),并且含有KRAB结构域的基因(KZFPS)也倾向于在肺鱼的卵巢中高度表达(图S2F)。 这在很大程度上不同于含有RVT_1的扩展基因家族,后者倾向于在包括卵巢在内的所有组织中具有低表达水平(图S2F)。 这表明红皇后假说可能适用于肺鱼的情况,因为在肺鱼中进化出了更多的KRAB结构域和含有KRAB结构域的基因的高表达,可能是为了抑制TE活性。 总之,上述结果表明,非洲肺鱼基因组在进化出更高的TE抑制和长基因转录能力的同时,也具有去除垃圾DNA的能力。
硬骨鱼类的祖先核型
通过使用6个物种的染色体信息,包括白斑竹鲨(Zhang et al,2019),Bichir(Bi et al ,2021),斑点雀鳝(Braasch et al,2016),非洲肺鱼(P Annectens)、西方爪蛙(Hellsten et al,2010)和鸡(Warren et al,2017),代表了脊椎动物的主要谱系,共重建了32条原染色体(图3A;表S5硬骨鱼类最后共同祖先(LCA)的),这与之前的估计一致(Nakatani等人,2007年) 虽然从硬骨鱼的LCA到辐鳍鱼的LCA观察到了两次分裂事件(表S5),但在从硬骨鱼的LCA到四足动物的LCA的进化过程中,没有观察到主要的染色体融合/分裂事件(图3A)。
此外,我们注意到原始染色体11-20和13-28在肺鱼和斑点雀鳝中应该是独立融合的,因为它们在鸡、蛙、比希尔或鲨鱼中没有融合(图3B和3C)。 在斑点雀鳝和西爪蛙之间以及肺鱼和比希尔之间也观察到类似的独立融合(图S3a和S3b;表S5) 不同谱系中共享融合事件的存在表明,染色体融合事件可能与原始染色体本身的某些特征有关。
从硬骨鱼类到四足动物高度保守元件、基因和特异表达基因的进化分析
我们利用12种硬骨鱼类(包括软骨鱼类、辐鳍鱼类和肉鳍鱼类)的基因组,鉴定了不同谱系的高度保守元件(HCEs)。 肉鳍鱼类、肺鱼-四足动物和四足动物的CA分别获得2,157、1,191和4,916个HCE。此外,在肉鳍鱼类、肺鱼-四足鱼类和四足鱼类的CA中分别丢失了388、559和394个HCEs,但在软骨鱼类和鳍鱼中存在。 这些HCE包含保守的非编码元件(CNEs)和编码元件 此外,从5个物种的9个组织的220个样品的转录组中,包括鳄雀鳝、比奇鱼、肺鱼、青蛙和小鼠(等。 ,2021),我们观察到40个基因在四足动物、肺鱼和辐鳍鱼中经历了组织特异性的表达模式变化(表S6) 这些HCE和特异性表达基因的最重要的情况将在以下章节中讨论。
呼吸系统的进化
肺表面活性剂被认为是肺进化的关键(Liem,1988)。 它们能降低肺泡的表面张力,有利于呼吸时肺的扩张和收缩。 先前的一项研究表明,表面活性剂中的胆固醇/磷脂比率(mg/mg)在辐鳍鱼中要高得多,(0.2–0.27)而非洲肺鱼和四足动物(0.05–0.075)(Daniels和Orgeig,2003年) 胆固醇的作用是微妙的,因为它可以赋予肺表面活性物质正确的液体和粘度(Orgeig和Daniels,2001),而过量的胆固醇抑制表面活性物质的功能(Leonenko等人,2007). 为了缓解这一矛盾,表面活性剂蛋白C(SP-C)有助于维持表面活性剂中胆固醇的存在,而不会造成功能损伤(Gogo mez-Gil et al,2009;Roldan等人,2016年)。 编码SP-C的基因SFTPC被发现起源于重复,因为肉鳍鱼类的MRCA和进一步的重复在非洲肺鱼中产生了三个拷贝(图4A)。 我们的原位杂交结果清楚地表明,它们确实在肺鱼的肺中表达(图4B),因此可能在调节肺表面活性物质中发挥作用.
与新进化的SFTPC基因一致,有三个基因在非洲肺鱼、非洲爪蛙和小鼠的肺中高度表达,但不在比希尔和鳄雀鳝的鱼鳔中表达,并且在功能上都与肺表面活性物质相关。其中之一(图S4A),SLC34A2,在肺表面活性物质循环过程中运输磷脂释放的磷酸盐中起关键作用(Izumi等人,2017)。 我们的原位杂交结果证实,SLC34A2在辐鳍鱼的鱼鳔中几乎不表达,但在肺鱼和四足动物的肺中高度表达(图4C)。 先前的研究表明,SLC34A2在硬骨鱼的肠道和肾脏中表达,以提高磷利用效率(Chen et al,2016,2017)。 SLC34A2在肉鳍鱼类肺中的募集可以满足对肺表面活性剂的更大需求。 另外两个肺高表达基因(图S4A),NKX2-1和NRP1,与肺表面活性物质的上调有关(Attarian et al,2018;Joza等人,2012年)。 我们鉴定了一种位于NRP1上游的肉鳍鱼类特异性CNE(图S4B)。 我们的体外报告基因分析实验表明,CNE具有增强子活性(图S4C),这可能改变了NRP1基因从辐鳍鱼到肉鳍鱼类的表达模式 总之,SFTPC的出现和肺表面活性物质循环能力的增强可能有助于非洲肺鱼和两栖动物之间的肺氧扩散能力(Jorgensen和Joss,2011)。
在导致四足动物LCA的谱系中发现了肺表面活性蛋白的进一步改变。在表面活性蛋白(SPS)的其余成员中,编码SPb的sFTPb是家族中最古老的成员;它存在于所有硬骨鱼中,但在软骨鱼中不存在(图S4D)。 我们观察到,虽然SFTPB基因在四足动物的肺中特异性表达,但它往往在辐鳍鱼和肺鱼的多种组织中更广泛地表达(图S4E)。 亲水性表面活性蛋白SP-A和SP-D主要参与肺先天宿主防御系统(Haagsman和Diemel,2001)。 我们观察到SP-A和SP-D编码基因起源于四足动物LCA以来MBL2基因的重复(图4D、S4F和S4G)。 此外,先前的研究表明FOXP1/2转录因子在肺发育中是必需的(Shu等,2007)。 我们观察到位于FOXP1基因内含子区的两个肉鳍特异性CNE和一个四足特异性CNE(图4E),以及靠近FOXP2的一个四足特异性CNE(图4F)。 我们的报告基因分析结果表明,这些CNE具有潜在的增强子活性(图4G)。
所有这些结果表明,肺呼吸能力的进化可能经历了三个阶段。 第一步是硬骨鱼类的共同祖先已经具有了最初的呼吸空气的能力,正如Liem(1988年)和(Bi等人所揭示的。 2021)这也被本研究中观察到的所有硬骨鱼中存在的SFTPB所证实。 第二步是通过基因创新增加空气呼吸能力,例如在肉鳍鱼类的生命周期评价中,在FOXP1附近出现了SFTPC和CNES。 第三步可能源于进一步的基因创新,包括在FOXP2附近出现SFTPA、SFTPD和CNE,为四足动物谱系中的高级呼吸系统提供了最后的关键基础。
五指肢的起源与陆地运动
五个手指的出现是脊椎动物从水到陆地转变的标志性事件(Clack,2009)。先前的研究表明,HOXA13和HOXD13是手指形态发生所必需的(Za´ka´NY和Duboule,1999)。 HOXA11和HOXA13在四足动物肢体中的排他性表达(Davis et al,2007),而它们在鳍中有很大程度的重叠表达(Metscher et al,2005),可能在这一过程中发挥关键作用(Kherdjemil et al,2016)。 有趣的是,我们观察到长度为67bp的四足特异性CNE,位于HOXA11上游200bp(图5A),其与反义转录物HOXA11AS204和HOXA11AS205重叠。 先前的一项研究表明,HOXA11AS205的表达模式负责HOXA11和HOXA13的排他性表达,并有助于从多指肢转变为五指肢(Kherdjemil et al,2016)。 我们的研究结果支持这一推论,这种四足动物特异性CNE可能是五趾肢起源的关键遗传创新。 然后,我们在不同的四足动物谱系中研究了这种CNE(表S7)。 虽然它在两栖动物、鳄鱼、海龟和哺乳动物中高度保守,但它在蛇和鸟类的基因组中发生了相当大的改变(图5B),这进一步表明它可能与手指的起源有关
从鳍到肢的转变导致了四足动物肢的三个部分,从近端到远端分别是茎足、轭足和自足。 通过确定顶端外胚脊(AER)的命运,发现两种古老的放线菌蛋白(由AND1/2和AND3编码)对鳍到肢的转变至关重要(Zhang et al,2010),有趣的是,腔棘鱼有两个拷贝,而肺鱼只有一个(AND1/2),四足动物失去了两个拷贝(图S5a) 转录组数据(Biscotti et al,2016)暗示了放线菌蛋白的进行性丢失,现在我们的基因组数据也证实了这一点 这一发现与之前的观察结果一致,即桡骨也存在于现代肺鱼和化石肺鱼中(Johanson等人,2007;Jude等人,2014年)。 此外,我们发现HOXB13开始的约40个连续氨基酸(AAS)在非四足脊椎动物中高度保守,而在四足动物中已经丢失(图5C)。 先前的研究表明,该基因在发育中的后肢的远端间充质中表达(Carlson等,2001)。 HOXB13在蛋白水平上的改变可能与鳍肢转换有关。
除了形态发生的变化外,四足动物还需要它们的轴突,特别是运动神经元,离开脊髓来支配四肢的肌肉。 前肢的轴突产生颈部扩大,而后肢/尾巴的轴突产生腰部扩大(Butler和Hodos,2005)。 HOXC10和HOXD10已被证明在建立小鼠腰椎运动神经元柱状、分区和运动区身份中起关键作用(Wu et al,2008)。 两个四足特异性CNE(图5D)位于上游(3kb和2 HOXC10的5kb)可能与四足动物的陆地运动有关,我们的报告基因分析表明它们是候选增强子(图S5b)。
潜在增强的抗焦虑能力
在脊椎动物从水到陆地的转变过程中,大脑内发生的众所周知的变化之一是在边缘系统中,其中杏仁核的基本细分和连接在四足动物(布鲁斯和尼瑞,1995年)中建立,也可能在肺鱼(冈萨雷斯和诺斯卡特,2009年;诺斯卡特,2009年)。 通过全基因组扫描,我们鉴定了两个新基因,NPSR1和NPS,它们出现在肺鱼和四足动物的LCA谱系中(图6A)。 这两个基因分别编码神经肽S受体(NPSR)和神经肽S(NPS),可以促进觉醒和抗焦虑样作用(Xu et al,2004UNK6,适度的应激处理,并增加杏仁核UNK7的突触抑制Dannlowski et al,2011;Medina等人,2014年;Streit等人,2014年)。 它们以前被认为只是四足动物特异性基因(Reinscheid,2007)。 我们的研究结果表明,NPSR1基因起源于肉鳍鱼类中催产素受体基因的复制,并且主要在脑和脊髓中表达(图6B)。 NPS从肉鳍鱼类的前体序列重新起源(图S5c)。 我们还观察到它们在该物种的脑和脊髓样本中表达的证据(图6B),表明肺鱼具有原始的NPS/NPSR系统 证据还表明,NPS是由杏仁核产生的(Xu等人,2007)。 结合这些结果,这对新起源的基因可能暗示了肺鱼和四足动物谱系中抗焦虑能力的增强。
除NPS/NPSR外,杏仁核内的γ-氨基丁酸(GABA)是另一种用于控制恐惧和焦虑感的关键抑制性神经递质(Babaev等人,2018b) 位于GABA相关基因编码区的两个硬骨鱼类HCEs在谱系中缺失或插入,导致四足动物和肺鱼的LCA。 第一个基因,IGSF9B,其产物具有6个氨基酸缺失(图6C),被证明在GABA能中间神经元中强烈表达,并与NLGN2形成复合物作为抑制性突触组织(Babaev et al,2018a;Woo等人,2013年)。 第二个基因,ARFGEF1,可以维持膜表面突触后GABAA受体(Teoh等人,2020),具有含有两个-AA插入的产物(图S5D) 此外,在四足动物和非洲肺鱼(表S6)的大脑中观察到的唯一特异性表达的基因GH编码生长激素 研究发现,杏仁核中GH的上调与恐惧记忆的建立有关(Gisabella et al,2016)。 总体而言,肺鱼和四足动物共有的这些遗传创新与先前的观察结果一致,即四足动物样杏仁复合体起源于导致肺鱼和四足动物CA的谱系(Gonzagon lez et al,2010;Maximino等人,2013年)。
咽部重塑
随着陆生脊椎动物的主要呼吸功能从鳃转移到肺,鳃弓不再产生鳃。 鳃弓数量减少,从肉鳍鱼类的5个减少到四足动物的4个或3个(Graham和Shone,2019) 基因HOXB3被认为在调节咽弓的发育中是重要的(Tomotsune等,2000)。 在大多数脊椎动物中,位于HOXB3上游4kb的CNE在四足动物中不再保守(图S5E),这可能是两个咽弓缺失导致选择松弛的结果 同时,人类和其他四足动物胚胎发育中的第二弓被重塑以覆盖更多的尾弓,这导致了后弓的内化和后端外部开口的丧失(Graham和Shone,2019)。 自从四足动物出现后,甲状旁腺就从咽后囊出现;这些腺体负责调节体内储存的钙的释放(Graham和Shone,2019),这一功能是通过辐鳍鱼的鳃实现的(Okabe和Graham,2004) 研究发现,PAX1基因与第二弓后方的咽囊(Okada et al,2016)和甲状旁腺(Su et al,2001)的发育直接相关。 我们鉴定了PAX1上游的四足特异性CNE,其可作为增强子(图S5F和S5G)。 GCM2基因对于甲状旁腺的分化和存活至关重要(Liu等,2007)。 我们注意到,该基因在辐鳍鱼和非洲肺鱼的鳃中高表达,而在爪蛙的鳃中低表达(图S5h),这表明在四足动物中,相应的功能已经从鳃转移到了甲状旁腺。
肺鱼的特化特征
非洲肺鱼可以在泥地里夏眠几个月甚至几年,以度过干热季节(Filogonio et al,2017)。 对6条非洲肺鱼(进行夏眠处理。 Annectens)个体,收集并分析了6个夏眠个体和3个非夏眠个体的11个组织的转录组数据 我们发现夏眠和非夏眠个体之间的总体表达谱高度相似(图S6A和S6B)。 在脑(超几何检验中,下调的基因在激素活性中富集,调整后的P值=8.431013)和皮肤中含胶原的细胞外基质(调整后的P值=8 03103)(图S6B) 在10个或更多组织中上调的10个基因中,有8个是热休克蛋白基因(图S6c)。 热休克蛋白的全球表达增加可能在干燥和炎热季节保护肺鱼。 齿系模式是肺鱼的另一个独特特征,被认为在肉鳍鱼类中高度衍生(乔和朱,2009)。 它们的单个牙齿呈放射状排列,与牙板融为一体,不会因脱落而丢失。 在某种程度上,它们与盾皮鱼的齿状齿系相似,盾皮鱼也从不脱落(Zerina和Smith,2005)。 我们在18种脊椎动物中检测了51个已报道与牙齿发育相关的基因(Bei,2009 在大多数脊椎动物中存在的基因中,没有一种在肺鱼中缺失。 只有一个基因,PAX9,被发现在除肺鱼以外的脊椎动物中保守的区域中具有显著的特异性突变(图S6D)。 此外,我们还在肺鱼的PAX9基因中检测到阳性选择信号(图S6E)。 PAX9决定了牙胚外观的确切位置,该基因的突变与人类少牙有关(Suda et al,2011)。 肺鱼中的特定突变可能导致其特定的齿系。
讨论
肺鱼基因组庞大,导致其基因组序列长期缺失,成为研究脊椎动物从水到陆的进化机制的巨大障碍。 结合ONT单分子测序技术、光学作图和HI-C技术,我们成功获得了高质量的非洲肺鱼染色体水平的基因组组装,这是迄今为止报道的最大的测序基因组.与最近发布的澳大利亚肺鱼基因组(Meyer et al,2021)相比,其缺失了21%-35%的基因组序列,我们的组装几乎是完整的,并且更加连续,染色体N50大小加倍.我们的组装也为非洲肺鱼带来了更好的基因注释,并且在脊椎动物中的1:1直向同源物数量比澳大利亚肺鱼高出7倍以上。 然而,这两个可用的肺鱼基因组为理解脊椎动物从陆地到水域的转变和神秘的肺鱼物种的进化提供了重要的资源。
我们的比较基因组分析显示,脊椎动物向陆地的转变涉及不同种类的基因创新。 有趣的是,除了四足动物的单系群外,没有一个脊椎动物谱系成功地出现在陆地上。 考虑到非硬骨鱼的辐鳍鱼仍然保留着原始的呼吸系统(Liem,1988),并且它们已经拥有了陆地生命所必需的大部分基因(Bi et al,2021),我们提出了水到陆地进化的三步方案:首先,硬骨鱼的共同祖先进化出了最初的呼吸空气的能力;然后,与空气呼吸能力相关的遗传创新(E。 G 新基因SFTPC和SLC34A2的募集),神经系统(E G 新基因NPS和NPSR)以及其他改进使得肺鱼和四足动物的CA能够暂时离开水;最后,四足动物的CA获得了适应陆地生活的呼吸和运动系统。 值得注意的是,犁鼻受体(VR)基因在肺鱼中的扩增可能并不像Meyer等人所认为的那样是四足动物中的独特创新。 (2021)因为盲鳗、一些辐鳍鱼和一些四足动物也具有显著扩大的VRS(Bi et al,2021),并且SALL1基因附近的HS72增强子不是肉鳍鱼类的起源,因为它存在于除斑马鱼以外的辐鳍鱼中 显然,需要进行更多的研究,以揭示在这两个最初的肺鱼基因组学研究中观察到的遗传变化的具体功能作用。