Regulatory activities of transposable elements: from conflicts to benefits
摘要:
转座子(TEs)是受到严格调节的,具有生物化学活性的非编码元件,如转录因子结合位点和非编码rna的丰富来源。 最近的许多研究重新证明,这些元素普遍参与了宿主基因的调控。 我们认为,TEs的固有遗传特性及其与宿主的相互冲突的关系促进了其在不同基因组中调节功能的补充。 我们回顾了最近的发现,这些发现支持了长期存在的假说,即生物体承受的TE入侵浪潮已经催化了基因调控网络的进化。 我们还讨论了剖析和解释TEs在健康和疾病中编码的调节活性的表型效应的挑战。
背景
- 转座子可以传播预先构建的调控元件,从而调控基因组的网络
- 转座子在基因组中的因转座子的大量复制和对宿主基因组水平上发挥作用,器有害有利
- 大部分转座子参与了广泛的调控过程和分子相互作用
- 总结:
1.TEs是全基因组范围内调控元件的来源在实验上捕获TEs调节活性的能力方面的最新进展,主要侧重于它们作为顺式调节对DNA的影响
2.这些调控活动中的大多数都可以解释为TE用来在基因组和宿主群体中传播的策略的遗物
3.TE不会对生物基因组产生广泛的适应性,只会偶尔对其基因组产生长期的影响
4.TE在发展和对生物基因组进行调控的权衡
5.TE衍生功能的失衡控制如何导致转录失调,从而促进疾病的发展。
是什么使TEs具有顺式调节活性
自主TE编码的基因可独立于宿主染色体而进行复制。但是他们依赖宿主的基因机制去表达他们的基因。
TE具有顺式作用调控元件,类似于启动子
eg: 1.LTRs:(例如内源逆转录病毒(ERV)的末端重复元件中,顺式调控序列和RNA聚合酶II(Pol II)启动子一式两份地存在于两个LTR中,每个LTR均位于元件编码序列的两侧**。
2.LINEs: 一类通过靶标引发的逆转录进行逆转座的非长末端重复反转录转座子。具有位于其5'非翻译区(UTR)中的内部Pol II启动子以及一个反义启动子。
3.SINE,由LINE复制机制复制的一类非自主反转录转座子。源自Pol III转录的细胞基因(例如,转移RNA(tRNA)或7SL RNA)。完整的全长SINE副本包含能够募集Pol III8的内部序列基序(A和B框)。TE的丰度,形式和复制机制的多样性极大地影响了启动子的命运以及它们携带的顺式调控元件。
TE的丰度,形式和复制机制的多样性极大地影响了启动子的命运以及它们携带的顺式调控元件。 例如,LTR元件复制的机制要求每个新的插入将在宿主基因组中引入LTR的两个精确拷贝。 然而,在插入之后,这些元件经常在其LTR之间经历异位重组。 这些事件导致这些元素的编码区的去除,但留下完整的孤立LTR,这些LTR包含原始的顺式调控序列。 ERV占人类基因组的8%左右,但90%作为单独的LTRs10存在。 相比之下,LINEs占了人类基因组的一大部分(约20%),但是绝大多数插入后会被5'截短,从而删除了它们的启动子序列10。 同样,通常通过剪切和粘贴机制转座的DNA转座子大多以微型反向重复TE(MITE)的形式繁殖,这些反向TE由自主元件的内部缺失衍生物产生[11]。 可以预见,许多MITE缺乏其亲本元件的启动子序列。 总之,并非所有TE插入物在保留其原始启动子和顺式调控元件的能力上都是“创造的”相等(图1a)。
至于典型的宿主基因启动子,TE启动子通常表现出在空间或时间上调节的活性,该活性取决于细胞类型或对环境信号(如压力或感染)的响应[12,13]。 尽管很少有TE启动子得到广泛表征,但众所周知,一系列TE具有通过顺式调控序列簇建立的调控表达模式。 就像规范启动子和增强子一样,这些序列可以募集和“整合”宿主编码转录因子的特定组合8,14–21。
哪些进化力塑造了TE启动子的调控特性? 为了使新的TE插入通过垂直继承得以持续,转座事件必须发生在种系中或种系发育之前,这导致对TE在种系中具有转录活性的强烈选择。 实际上,在植物22和动物23中,许多TE的表达似乎都限于配子发生或胚胎早期发育的各个阶段(方框1)。 矛盾的是,一些TEs在一系列生物体25-25中的体细胞组织中也具有严格调节的活性。
考虑到体细胞转座事件不是跨代遗传的,因此这些组织中的活性不会立即对TE产生任何明显的益处或后果。 试图推测体细胞TE活性的调节可能反映了宿主与TE之间的共生关系。 另一个但非唯一的解释是,这些体细胞调节活动以前是通过在TE上进行选择来塑造的。 例如,所有ERV都源自感染性逆转录病毒,这些逆转录病毒必须感染了生殖细胞(或其祖细胞),而且可能还感染了来自各种组织的体细胞。 因此,ERV过去的病毒生活方式可以解释为什么它们的LTR包含复杂的调控元件,这些调控元件能够驱动多种组织和细胞类型的转录。 无论驱动体细胞活动的进化力如何,很明显,TEs都可能影响种系和早期胚胎发育以外的宿主基因调控。TE在基因中的非随机整合
随着TE进化出基本上模仿宿主顺式调控元件的调控序列,自然可以得出这样的结论:落入宿主基因附近的TE插入物很可能会干扰其表达。 因此,TE最初插入基因组的位置通常会表明其在种群中的命运。因此,许多TE似乎已经进化出了促进整合到基因组区域的机制,从而最大化了其传播机会。例如,一些TE家族已经进化出复杂的分子机制来靶向基因组“避风港”,例如基因不足或异源区域,而其他TE家族则倾向于整合在开放的,具有转录活性的染色质区域内。 例如,玉米27中的诱变元件,水稻28中的mPing MITE,裂变酵母29中的Tf1逆转录元素和黑腹果蝇30中的P元素都积极地靶向基因的5'区域。 一些逆转录病毒,包括HIV1,优先整合到基因组高度转录的区域内31。 据推测,这种传播方式可确保新整合的元素驻留在有利于表达和传播的环境中。 此类元件可能具有更强的调控邻近基因表达的倾向,并且如果自然选择可以容忍,则可能更倾向于顺式调控共存-可能在插入后立即出现28。 最后,重要的是要注意,随着TE传播后时间的流逝,诸如选择和遗传漂移之类的作用力可能会掩盖最初的整合偏好。TEs是调节活动的丰富来源。TEs广泛分布的顺式调节元件对基因组调节和细胞功能有什么影响? 为了应对TEs在其基因组中的寄生负担,真核生物似乎已经进化出阻止TE转录的多层机制[22,32,33]。因此,一般认为大多数TE细胞来源的DNA在大多数细胞中都是沉默的,并且在化学上是惰性的。 然而,在过去的几十年中,不同种类的物种都记录了由TE启动子驱动的宿主基因的实例14、21、34-36。 这些情况是否仅代表个别TE逃脱了宿主沉默的罕见事件,还是暗示了普遍的监管活动。
大量文献显示了多种机制,通过这些机制,TE可以改变顺式,反式,转录或转录后转录宿主基因的表达[14,37](图1b)。 尽管这些机制中的大多数最初是通过从头进行TE插入引起的诱变的遗传分析发现的,但是基因组研究表明,这些活性贯穿整个基因组,并且通常源自长期固定在宿主群体中的TE。 特别是,全基因组检测,例如那些定位转录活性,开放染色质或转录因子结合的检测,提供了令人信服的证据,证明许多TE衍生序列具有活性调控元件的生化特征。 总之,这些研究表明,TE不像通常假设的那样健壮或系统地静音。
值得注意的是,转录组分析已发现TEs是组织特异性和/或替代性启动子的丰富来源。 两种主要方法已允许在全基因组范围内绘制TE衍生的启动子。 首先,对全长cDNA进行深度测序(一种RNA测序(RNA seq)形式)表明,在TE衍生启动子内起始的嵌合转录物构成了哺乳动物转录组的相当一部分,特别是在早期发育阶段38(框1),但在许多其他哺乳动物组织中39。其次,通过对转录起始位点进行定位的方法,例如基因表达的帽分析,然后进行测序(CAGEseq),揭示了人类和小鼠细胞类型和组织中TE内惊人数量的Pol II起始12(例如,高达30% 人类胚胎中定位的所有转录起始位点细胞)以及黑腹果蝇的胚胎发育40。 越来越多的证据表明,TEs是植物中启动子活性的重要来源36。 因此,TEs似乎在许多物种中分散了许多受发育调节的启动子,这些启动子通常保持活跃并以组织或阶段特异性方式驱动相邻DNA的转录。
越来越多的证据表明,TE提供了大量其他类型的顺式调节元件,包括增强剂,绝缘子和阻抑元件。 在哺乳动物中,染色质免疫沉淀后再进行测序(ChIPseq)研究表明,对于任何给定的转录因子和所检查的细胞类型,TEs在基因组中占结合位点的很大一部分(5-40%;平均〜20%)15,19 。 LTR元素比其他TE类型的贡献更大[14,21,41],这可能是因为LTR更可能拥有并保留其祖先的顺式调节活性,如上所述(图1a)。 重要的是,对于给定的转录因子,大多数TE衍生的结合位点是由相当少量的特定TE家族贡献的,这些家族相对于基于这些TE家族在密度上的密度所期望的转录因子结合事件高度富集。 基因组17、19、42、43。 在大多数情况下,已经检查了结合位点的起源和序列,可以推断出典型的结合基序预先存在于祖先TE序列中,随后通过转座而分散在基因组中,这种情况与“复制粘贴”相符。 转录因子结合位点分散模型14。
有趣的是,TE衍生的转录因子结合位点倾向于是谱系特异性的。 例如,在分析两个可比较的人类和小鼠细胞系中26对直向同源转录因子的结合事件时,在每个物种中鉴定出的> 130,000 TE峰中,> 98%是物种特异性的19。 这一结果可以部分地由以下事实解释:大多数结合事件发生在TEs中,而TEs在两种被检种分裂后已经扩增。 即灵长类或啮齿动物特异的TE家族。 另一个因素是,更古老的TE积累了更多的中性取代,导致其祖先转录因子结合位点的降解。 这些祖先TE序列在物种间的差异衰减也可能导致物种特异的转录因子结合事件。 无论如何,这些数据表明转座代表了哺乳动物进化过程中获得新的转录因子结合位点的共同机制。
TE也已被证明可以用作绝缘体和/或边界元素。 此类序列的功能通常是通过阻止异染色质44的扩散,将基因组划分为大小为100 kb至1 Mb的有效或无效转录域。 几项研究表明,许多TE,尤其是SINE,都具有与CTCF或TFIIIC(也称为GTF3C1)等因子的结合位点,这些因子赋予绝缘子活性并组织了核结构45-47。 这些TE的一个子集似乎可以通过充当“锚”来分离基因组的转录,从而在基因组的三维组织中发挥作用。 确实,使用染色质相互作用图谱研究全基因组范围内这些拓扑基础的染色体内或染色体间相互作用的研究发现,SINE在这些域的边界处富集48-50。 通过为建筑因素提供丰富的结合位点来源,TEs可能是高级基因组组织的重要贡献者,后者控制着包含许多基因的大染色体区域的转录调控。
除了提供顺式调控DNA元件外,TEs还被证明可贡献大量非编码调控RNA转录本,例如microRNA(mi RNA)和长非编码RNA(lncRNAs),它们可调节反式顺式中的基因表达(BOX 2 最后,虽然我们主要将本综述的重点放在TE序列内编码的调节活性上,但TEs还可以通过许多其他作用(包括其染色体整合的破坏作用)改变基因表达。 一个有趣的例子是在黑腹果蝇中基因CG11699的3′UTR内自适应插入POGON1 DNA转座子。 插入会破坏基因的“正常”(祖传)聚腺苷酸化信号,导致较短的3ʹUTR,升高的mRNA水平和增强的对异源生物胁迫的抵抗力51。 由于被宿主沉默途径靶向,TEs也可能对基因组调控产生广泛的影响32(图1b)。 特别是,在TE序列处成核的抑制性染色质可能会“扩散”到相邻区域并沉默附近基因的表达,这种现象已在包括植物52和哺乳动物53在内的多种生物中观察到。
TE调节活性的生物学效应以上概述的工作坚定地认为TEs是宿主细胞中生化调节活性的丰富来源。 这些观察提出了一个问题,即这种现象是否对物种的生物学和表型演变产生了重大影响。 尽管将源自TEs的严格控制的调节活性解释为在生理或发育中的广泛作用的指示可能很诱人,但仅此活性的生化表现并不意味着它对于适当的基因组功能至关重要54,55(图1c )。
图1TE调控活动的起源及其如何影响宿主基因。a| 主要转座因子(TE)类及其典型遗传组织的示意图。 左面板描绘了每种TE类型的通用全长版本。 大多数TE都具有起到促进自身转录和调控作用的调控序列,例如RNA聚合酶II(Pol II)或Pol III的启动子以及聚腺苷酸化信号(PAS)。 右图显示了每种TE类型的结构,因为它们最常出现在基因组中,具体取决于TE(请参阅正文)。
b|图描述了TEs所产生的不同类型的调节活动。这些包括顺式调节性DNA和RNA元件介导的效应(右图),以及TE产生的非编码RNA和蛋白质介导的反式效应(左图)。c | 确定宿主功能是否已被TE所影响时要考虑的证据层次。 根据全基因组测定,许多TE具有调节活性的生化标志。 但是,还需要其他证据来确定这些TE中的哪些会改变宿主基因的调控并影响生物表型和适应性。 ERV,内源性逆转录病毒; 线,长散布的核元素; lncRNA,长非编码RNA; LTR,长终端重复; MITE,微型反向重复转座元件; SINE,短散布的核元素; sRNA,小RNA; TIR,终端反向重复; TPase,转座酶。