2019年,接连3篇高水平染色体外环状DNA的研究论文引爆了这一几十年前就已发现的一种存在于染色体外的DNA形式的研究热潮。当然,不仅仅文章的发表,这一研究方向能够得到如此多的关注也是因为高通量测序技术的应用使得对eccDNA的作用感兴趣的研究人员有了更加便捷的研究方法,降低了研究的门槛。
一、eccDNA的研究历程
首先,我们来看什么是环状DNA。环状DNA是一种生物界普遍存在的DNA形式,如常见的线粒体DNA、叶绿体DNA、细菌基因组、细菌质粒、部分病毒基因组等。那么本文要讨论的染色体外环状DNA同上述提到的几种形式有什么不同呢?我们都知道线粒体DNA和质粒的都是以线性的DNA的形式存在的,其染色质成分并没有组蛋白,因而也不存在核小体的结构,并且不会发生染色体序列的折叠和三级结构。而eccDNA,既然叫做染色体外环状DNA,那么它首先应该是存在于真核生物当中的(原核生物、细胞器、病毒等不存在染色体的结构),其次必须是以环状的形式存在的,再者是游离于染色体外的,并且具有完整的核小体结构,也就是说,其染色质的组成是与正常的染色体相同的,因而也具有染色质折叠、压缩和特有的空间结构。
染色外环状DNA早在1965年就已经被报道,这是首次在小麦胚乳细胞和猪精子当中发现的DNA存在形式。
同年其他研究人员报道在人的肿瘤细胞中发现了eccDNA,并且发现是都是以成对的形式存在,因此被称作“双微体”,这也是双微体概念的首次提出。(大家注意一下下图中染色体旁边成对出现的小黑点就是双微体)
接着陆续有研究发现双微体中能够携带癌症基因,如EGFR和MYC基因通过eccDNA在肿瘤细胞中扩增了40%(Cancer Genetics and Cytogenetics, 2008);在胶质瘤中发现癌细胞通过形成eccDNA造成携带的EGFR和MYC基因大量扩增(PNAS, 2014)。
尽管诸多研究成果都是基于双微体研究来进行的,但是事实上,后续研究证明并非所有的eccDNA都是以双微体的形式存在的。2017年,Nature发表了一篇首次利用高通量测序技术对17个肿瘤样本的大规模eccDNA研究,发现只有~30%的eccDNA是以双微体的形式存在的。同时也证明不同eccDNA在不同的肿瘤样本中是普遍存在的,但是含量有很大差别。
可以说从2017年的这篇文章起,eccDNA的研究真正进入的高通量测序时代。目前为止主要包含以下几篇文章:
2017年:Nature,17种肿瘤的2572种细胞系的全基因组测序分析,证明eccDNA在肿瘤组织中普遍存在;
2018年:Nature Communications,健康人的肌肉和血液细胞中分离到超过十万种eccDNA分析,它们绝大部分都携带基因或基因片段,证明eccDNA在正常组织中是普遍存在的;
2019年:Nature Genetics, eccDNA驱动神经母细胞瘤基因组重塑;
2019年:Nature,eccDNA促进染色质可接近性和致癌基因的高表达;
2019年:Cell,功能性增强子自造成染色体外癌基因的扩增;
二、eccDNA可能的形成机制
eccDNA究竟是如何形成的,目前尚没有十分确切的解释,目前推测的可能机制包括以下几种:(A)DNA复制过程中,形成发夹结构,接着在DNA聚合酶的作用下,通过滑动形成环状,并从染色体中切割下来并复制形成双链环状DNA,这种形成方式的特点是染色体原始位置上的这段序列发生了缺失;(B)DNA复制时形成R-loop结构,在这种结构中,其中一条链发生折叠,形成环状结构并切割下来,形成环状DNA,发生断裂的双链通过DNA的损伤修复机制进行补齐,因此这种方式不会造成染色体原始序列的损伤;(C)通过DOIRA模型,通过双链复制的方式形成;也不会造成原始序列损伤;(D)通过双链的同源区域的重组,造成双链同时断裂,往往通过这种方式会产生Mb以上的较大的eccDNA,并且原始序列会发生缺失。
所以,总的来说,eccDNA的形成是依赖于DNA的序列特征、复制过程和DNA损伤的修复的。从目前已有的研究进展来看,就序列特征而言,串联重复序列会更容易造成eccDNA的形成;并且大部分的eccDNA有段重复序列,但是也有相当的部分没有重复序列,不能与任何附近的序列发生重组;高GC、转录激活区域,像R-loop形成和修复促进eccDNA的形成;同源重组会切除重复DNA产生序列更大的eccDNA。而就DNA损伤修复而言,研究发现致癌物会提高eccDNA的水平,同时一些特异的DNA损伤修复蛋白是eccDNA形成所必需的,但是还有一些是非必需的。最后,虽然我们在上述eccDNA推测的形成机制中提到的大多是与DNA复制有关的,但事实上,不发生DNA复制的情况下,eccDNA也可以存在。所以说,eccDNA的形成并不是一个简单过程,而是可能由多种因子,多种蛋白,并且有一个复杂的调控机制参与的过程,具有很重要的生物学功能。
三、eccDNA的大小和类型
eccDNA的大小从几百bp到几十Mb不等,其中较小的一种是2012年Science报道的被称作MicroDNA的特殊的eccDNA,大小只有200-400bp,有片段过短,因此不能携带完整的基因序列;但是目前MicroDNA被认为具有一些重要的调节功能,包括调控RNA的转录过程,或者通过分子海绵的作用调控一些非编码RNA的表达,同时这种DNA也被认为是可能在未来应用于液体活检来监测癌症的发生发展的一种体外游离DNA的形式。双微体形式存在的eccDNA一般较大,100kb-3Mb等,很多可以在光学显微镜下被观察到,能够携带一些完整的基因结构和上游的调控序列。那么类似双微体或非双微体形式存在的这种大型的eccDNA形式也是最有可能携带完整功能基因结构的,被关注最多的,也是相对更容易开展后续研究的形式。
四、eccDNA的功能
eccDNA目前已经有很多的功能被证实,包括介导细胞的衰老,如上表中的rDNA circle,被证明在酵母细胞衰老过程中发挥作用;基因补偿效应在组蛋白H2A-H2B的编码基因研究中被发现,敲除后会造成eccDNA中的同源基因显著扩增;肿瘤的适应性进化和异质性在2019年的几篇文章中都有报道;抗药性早在1978年就已经证实携带DHRF基因的双微体会造成小鼠细胞的氨甲喋呤耐药,2014年一篇研究发现eccDNA中的EGFR基因突变会造成胶质瘤的耐药性(Science, 2014)。
关于细胞间异质性的推测主要是因为eccDNA中没有着丝粒的结构,在细胞发生有丝分裂时会随机分配到子代细胞中。但是在细胞准备发生分裂时,是否会有专门的机制调控eccDNA提前进行复制后分配,没有看到相关的研究报道。
在eccDNA的随机分配后,获得有利于细胞生长的eccDNA会保持生长的优势,这或许是肿瘤组织内异质性和原发癌/转移癌中异质性发生的机制之一。但是目前尚没有实现从单细胞层面检测eccDNA的方法,所以细胞间异质性和互作还难以实现,其他方面的研究也还没有相关研究报道出来。
五、eccDNA的分析方法
目前已经报道的基于高通量测序方法研究eccDNA的报道都是基于Paul S. Mischel团队开发的AmpliconArchitect软件,基于二代全基因组测序数据(5-10X覆盖深度),该软件可自动比对基因组,寻找断点信息,并结合SV和CNV的分析结果生成eccDNA的分析结果。不过需要注意的是,目前该软件的license是收费的。
不过还可以考虑通过提取环状DNA和滚环扩增的方式获得eccDNA,并进行后续的测序和组装,这时候相对于对软件依赖的限制就相对较小了,但是对于线性DNA背景的排除依然是个问题,在基因组DNA的提取、扩增、质控及后续分析方面还需要诸多探索。
「2020年04月12日 ·北京」