R-loops是一种含RNA-DNA杂合体的三链结构,经常在转录中形成。R-loop的错误调控与DNA损伤、转录延伸缺陷、过度重组和基因组不稳定性有关。与这种非计划的R-loops形成对比的是:越来越多的证据表明,细胞利用有计划的调节性R-loops中的RNA-DNA杂交体来促进DNA事件,包括转录终止和基因调控的事件、端粒稳定性和DNA修复。由细胞内RNAs形成的R-loops可以调控组蛋白翻译后修饰,并可能被专门的阅读蛋白所识别。R-loops的双面性意味着它们的形成、所在位点和及时去除必须受到严格控制。从这个角度出发,本文讨论了调节性R-loops所调节的细胞进程、R-loops的调控机制以及调节性R-loops和非计划的R-loops之间可能存在的差异。
过去的十年彻底改变了我们对调节性RNA的认识。通过使用下一代测序,已经认识到基因组的很大一部分会被转录,有无数不同长度的RNA具有潜在的调控功能。虽然一些非编码RNA(ncRNAs)的生物学研究已经相当成熟,但对其他ncRNAs调控功能的了解仍处于初级阶段或难以捉摸。RNA以序列特异性的方式在基因组中发挥调节功能的一种方式是通过形成RNA-DNA杂交体。术语RNA-DNA杂交指的是RNA与DNA的碱基配对。当RNA-DNA杂交体的形成导致单链DNA (ssDNA)游离时,这种结构称为R-loop。RNA-DNA杂交体和R-loops在各种细胞进程中发挥了重要的作用,如基因调控和DNA修复,近年来受到人们的广泛关注。矛盾的是,R-loops长期以来一直被认为是有害的转录副产物,它干扰转录过程本身,并导致基因组不稳定性。R-loop诱导的基因组压力与未能及时去除R-loops直接相关。杂交体代谢障碍的许多负面后果是由于DNA复制机制与R-loops相遇而引起的复制应激引起的;然而,R-loops相关的转录延伸缺陷、DNA双链断裂(DSB)形成、突变发生和染色质状态改变也能够以复制无关的方式发生。有很多优秀的综述文章涵盖了失控R-loops的有害影响,并涉及R-loops的去除因素。
从这个角度出发,本文将讨论RNA-DNA杂交体和R-loops是如何被用作某些DNA事件的正调控因子和信号,重点放在转录调控和基因组完整性的维护上。然而,我们并不忽视R-loops的有害方面,它可以影响完全相同的过程。我们也讨论了可能决定R-loops和RNA-DNA杂交体命运的因素,以及这些因素如何影响杂交体是否具有调节性和生产性,或者是否具有计划性和非计划性/危害性。
非R-loop杂交体的作用
几十年来,人们已经知道RNA-DNA杂交体在各种核内进程中起着关键作用,尤其是转录和DNA复制。在DNA合成过程中,后随链的复制一个RNA-DNA杂交体功能的典型实例:DNA聚合酶α合成的RNA引物被DNA聚合酶δ聚合为成熟的冈崎片段。另一个RNA-DNA杂交体的功能实例发生在端粒上,端粒酶通过RNA-DNA碱基配对特异性地识别端粒序列,端粒酶由ncRNA和逆转录酶组成。端粒酶的RNA部分与存在于染色体末端的3´ ssDNA延伸杂交,使末端的延伸能够防止端粒被侵蚀。通常,当复制中的DNA聚合酶(最常见的为DNA聚合酶ε)将三磷酸核糖核酸错误引入到新合成的DNA链时,RNA-DNA“小型杂交体”就会形成。如果不有效地切除,错配的单磷酸核糖核酸(rNMPs)可能会损害基因组的完整性;但它们在DNA修复过程中也发挥着积极的作用,因为错配修复和非同源末端连接途径利用核糖核酸插入来促进基因组的完整性。在错配修复的情况下,rNMPs作为一种链识别信号,在新合成的链而不是模板链上指导错配碱基的修复。rNMPs如此丰富(在酵母中每个细胞周期有13000个rNMPs)的事实也暗示了其具有生物学功能。rNMPs在基因组中的积极和消极作用表明:它们是短暂的,受到严格的调控,以确保DNA的最佳修复,同时避免基因组不稳定性。上述杂交体不被认为是R-loops,因为它们不会导致DNA链游离。
R-loop的形成与分布
R-loops是由RNA-DNA杂合体和游离的DNA单链组成的三链结构。R-loop的特征已经在一些优秀的综述中被广泛讨论过。简单地说,三链结构通常但不完全与正在进行的转录有关,直到最近还被认为仅仅是转录的“副产物”,只以顺式(in cis)发生在转录位点上。负超螺旋以及RNA聚合酶附近发生的DNA变性(链分离),为新生转录本提供了一个理想的机会:以退火互补模板链,形成一个R-loop。虽然RNA-DNA杂交体不断地在RNA聚合酶的转录泡内形成,但R-loops不太可能仅仅是这种有限杂交体的延伸,而更可能是通过RNA的5´端再入侵所形成的。RNA聚合酶复合物的结构证实了这一点,RNA和DNA从复合物中以不同的出口通道被挤出,这将简单地阻止R-loop扩展形成。此外,最近的一项研究表明,共转录R-loops的有效形成需要一个自由的RNA末端和一个GC偏倚(双链之间鸟嘌呤和胞嘧啶分布的不对称性)。当RNA在不同的空间位置产生时,也可以形成反式(in trans)RNA-DNA杂交体。
RNA-DNA杂交体的检测方法对于理解R-loops是如何被调控的,以及定位它们在基因组中形成的位置和时间是至关重要。虽然检测RNA-DNA杂交体的主要工具是单克隆杂交特异性S9.6抗体,但替代试剂和技术已经出现。催化失活的核糖核酸酶H1(RNase H1,一种能够降解RNA-DNA杂交体的RNA部分)或RNase H1杂交体结合结构域融合荧光蛋白的酶可以用作杂交体的感受器。虽然杂交体的积累位点分布有普遍的共识,但不同检测方法仍会造成不同研究之间的差异。R-loops的一个守恒特征是它们的瞬时特性。这是在一项使用芽殖酵母的研究中首次提出的,该研究表明:只有当两种RNaseH都缺失时,才能检测到均匀分布的RNA-DNA杂交体核染色。这表明,杂交体经常出现,但会被RNaseH迅速去除,至少部分去除。随后,除了RNaseH之外,多种解旋酶也被证明有助于杂交体的去除。细胞核中分散的S9.6染色结果也表明,RNA-DNA杂交体在基因组的多个位点形成。这一结果在对酵母中杂合体位点进行全基因组测序后同样得到验证:结果显示酵母中杂交体位点广泛分布,包括逆转录转座子、端粒和高表达基因(如核糖体RNA、tRNA基因座和其他结构性ncRNAs)中大量存在。
R-loops在与反义转录相关的基因上显著富集,最近被证明其可以直接促进反义表达,表明它们在基因表达中起调节作用(见下文)。尽管有一项研究表明,在AT偏倚区域,特别是poly(A)区域可能是R-loop形成的热点区域;但普遍的共识是, R-loop积累的关键决定因素不是序列本身,而是基因座的转录率。事实上,通过改变启动子来提高转录率,一个R-loop缺失的位点就可以转化为R-loop富集位点。有一种倾向是富含GC的序列有更多的R-loops;同样的研究显示,酵母中富含GC序列的基因通常表达水平更高。在哺乳动物细胞中,GC偏倚十分有利于R-loop的形成(见下文)。然而,酵母基因组并无太多的GC偏倚,除了端粒区域。在植物中,GC偏倚和AT偏倚的区域都富集于R-loops中。高表达水平和R-loops之间的联系表明:要么高转录率促进R-loops积累,要么R-loops促进高转录率。也可以设想这么一个正反馈:通过转录导致R-loops的积累,从而再进一步促进转录。注意,已知R-loops是转录的有效抑制剂,会导致聚合酶停滞。R-loops与转录之间的矛盾关系表明,要维持高转录率,需要严格控制R-loops的持久性(半衰期),或者R-loops与开放阅读框之间存在空间分离。
一项对酵母的研究发现,RNA聚合酶Ⅱ(Pol Ⅱ)的一个亚基定位和R-loop热点区域之间的基因组重叠很少。这表明通过S9.6 DRIP绘制的R-loop图谱并不是记录正在进行的转录,而是一些可能持续存在或转录后形成的R-loops。这是一个早期迹象——表明R-loops可能不仅仅是转录的副产物,并暗示杂交体可能独立于转录形成,即以反式存在或从远处影响转录。
与酵母相似,R-loops在人类细胞和植物中在重复序列处所积累,如转座子、核糖体DNA、着丝粒和端粒。令人惊讶的是,在人类和植物中,R-loops在承载CpG岛(CGIs)的启动子区域也显著富集。CGIs存在于大约60%的人类基因的启动子上,其1个特征是阳性GC偏倚(GC skew+)的存在——在转录起始位点(TSS)下游的非模板链上,G比C富集。在启动子区域更精确的R-loop定位表明,R-loops通常限制在TSS和第一个内含子-外显子联接体之间。一般来说,强烈的GC偏倚与高基因表达、R-loop富集相关。以这种序列特异性方式积聚R-loops,可能是由于富含G的RNA对其互补序列具有特别强的热力学结合特性。此外,DNA二级结构的存在,如G-四联体(G4s),在游离的DNA上可以促进R-loop的稳定性——阻止分解R-loops的蛋白质进入或降低DNA的再次退火能力。最近一项使用原子力显微镜的体外研究表明,R-loops可以获得独立于G4s的二级结构。这些二级结构是在游离的DNA链上形成的,包括斑点(blobs)、刺(spurs)和环(loops)。这些R-loop构象对周围的DNA施加局部物理约束,例如弯曲DNA。一个有趣的可能性是,R-loop构象可以编码更高阶的调控信息,如通过招募不同的染色质修饰因子。在未来,确定这些R-loop构象是否存在于体内的染色质环境中是很重要的。
基因启动子上R-loops的存在首次强烈表明该结构可能具有重要的基因调控功能。除了启动子区域,全基因组的研究发现在转录终止位点上R-loops也有相当多的富集,特别是那些GC偏倚区域。这与R-loops促进转录终止的功能是一致的。同时,杂交体还出现于DNA损伤部位,包括功能缺失的端粒和DSB处,在协调DNA修复中也具有重要的功能。
长期以来,R-loops一直被认为是转录的偶然副产物,对细胞生理有害,不适当地删除会导致基因组不稳定性。然而,最近发现有一类有益的、“调节性”的R-loops,在各种生物过程中扮演着重要的角色。调节性R-loops利用RNA-DNA碱基配对的序列特异性来排斥或靶向不同的染色体位点的辅因子。原核生物中最重要的例子是CRISPR-Cas9系统,它在细菌中进化成一种天然防御机制,识别和破坏来自病毒的DNA。在细菌基因组中,整合到CRISPR序列中的病毒DNA被转录并与Cas9核酸酶结合,Cas9-RNA复合物在入侵的病毒DNA上形成一个序列互补的R-loop,使DNA产生断裂,最终导致病毒DNA被破坏。这个机制现在已经被用作一个高度精确和易于工程化的基因编辑工具,使用guide RNAs将Cas9靶向到基因组中的特定序列,这一过程涉及到反式R-loop的形成。
真核生物中调节性R-loops的第一个实例来自于免疫球蛋白重链位点的类开关重组研究:在G-rich的开关区域内形成的R-loops促进基于重组的缺失和驱动抗体类别转换。RNA-DNA杂交体的序列特异性使R-loops通过精确靶向启动子和终止子序列,成为调控基因表达的候选因子之一。
原文链接:https://doi.org/10.1038/s41580-019-0206-3
转载自微信公众号“YrSiyi小笔记”