这篇文主要参考 Tn5 as a model for understanding DNA transposition,来了解Tn5的转座机制。
- 转座概念
- 参与分子
- 转座过程
转座 (transposition)
可移动的DNA片段即可移动因子 (Transposable elements) 在基因组上自由转移称为转座,DNA与所插入的基因位点可以是非同源的。转座是产生基因多样性的重要机制,可移动因子可产生插入 (insertion),缺失 (deletion),倒置 (inversion) 以及染色体融合突变 (chromosomal fusion mutations)。[1]
转座需要通过转座酶的催化完成。根据 1)转座酶与DNA是否形成共轭中间体和 2)蛋白质活性残基 可以将转座酶分为5类: tyrosine (Y), serine (S), relaxase (Y1) and rolling-circle (Y2) , 这4类是转座酶与DNA形成共轭中间体;而第5类称为DDE转座酶,是通过酯基转移反应完成的。[2]
DDE转座酶的催化中心是由三个分离的区域N2,N3和C1,分别含有天冬氨酸 (D),天冬氨酸 (D) 和 1个谷氨酸 (E) 组成,虽然三个区域间有不同长度间隔区,但通过蛋白质折叠形成三联体参与催化。
原核生物的转座分为两种方式,复制转座和保守转座。复制转座的供体DNA完整,把通过复制的DNA片段插入基因位点上;保守转座则是从供体DNA上分离一段DNA,以转座酶作为中介,连接到目标DNA上而实现的 (又被成为 'cut and paste' 转座)。
Tn5是极好的模型来研究保守转座模式。
参与Tn5转座的三个大分子
- 转座子 (Transposon) :可移动DNA片段。
- 转座酶 (Transposase /Tnp) :催化转座的蛋白质;野生型Tn5转座酶是一种活性极低的蛋白质。
- 目标DNA (Target DNA):可以与转座子在同一个DNA分子上,甚至在转座子内;或在另一个DNA分子上。
1. 转座子
-
简化的转座子结构:
包含合成Tnp的DNA序列, 两个19bp 长的末端以及任意DNA序列。如图:
-
末端是两个19bp 长的片段,将Tnp和任意DNA序列包含在其中。有三种常见的末端:外端 (outside end /OE) ,内端 (inside end /IE) 和 镶嵌性尾端 (mosaic end /ME)。组合方式有两个反向的 OE, 或者两个反向的 IE,或者两个反向的 ME,又或者是两组反向的 OE 和 IE 组合。
如下图所示, OE 与 IE 有7个位点的不同,但在 IE 没有Dam-DNA甲基化的情况下,两类末端都可被 Tnp 识别。而 ME 混合了这7个不同的位点,是一种比OE与IE活性更高的序列。
位于两个末端中间的DNA序列只需要满足长度足够即可。该长度要能保证 Tnp 在与两个末端结合后,Tnp 可以相互结合形成复合物。
- Tn5 的转座子结构:
Tn5 转座子是由两个反向的插入片段 IS50以及两组OE 和 IE 构成。
- IS50 包括三个抗生素抗性基因。IS50R负责编码Tnp和转座抑制物 (Inh), 而IS50L负责编码两个低活性蛋白。
IS (insertion sequence): 插入序列,很小(< 2.5 kb)DNA片段,可以在不同的基因位点跳跃,或自我复制。通常存在于细菌与古细菌基因中,但也可存在于真核生物的转座元素中。编码的基因一般只与移动有关。 [2]
2. 转座酶
Tn5 Tnp 有476个氨基酸长; 属于IS4转座酶家族,其拥有YREK motif。
主要功能区:尾端DNA结合决定簇、二聚体结合域和活性位点 。
野生型 Tnp的主要特性是极不活跃 。在体外没有活性,而体内发生转座的概率仅为1/10^5细胞。通过四种类型的突变可使活性提升至少4个数量级:
1. 分离N端与 C端
以L372P为例,N端(含DNA结合域)与 C端(含二聚化结合域)相互抑制活性,导致这一现象的原因极有可能是两者之间距离太近。因此可以通过改变构象将两个结合域分离,从而提高活性。L372P是通过引入脯氨酸到靠近C端的α螺旋里,使得螺旋断裂,从而将C端拖离N端。
2. 提高Tnp与转座子末端的结合
以E54K为例,E54K提高了Tnp 与OE DNA的结合,而靠近 54残基的突变也可达到相似的提高效果。由此可见, DNA结合域的结构不是与OE 的结合的最优形态。其他研究表明,与IE 的结合也有相似的结论。
3. 形成直接的E-K相互作用,形成特定结构并与转座子末端的结合
E110 和 E345 残基通过形成 Mn++/Mg++盐桥。围绕在E345周围的残基(342,344 和348)能与末端DNA相结合, 说明110 和 345 残基形成的结构能够精准安排这个区域的残基与末端DNA结合。E110K或E345K的突变使得 110与345之间形成直接的E-K相互作用,由此削弱了盐桥的必要性。E-K相互作用可能改善了345区域结构而与末端DNA结合更易结合,或者在野生型Tnp中,没有足够的Mg++形成这个结构。
4. 提升形成 β-loop clamp的灵活性
242残基由P变为A/G将极大提高活性。这个突变提高了242-247在末端DNA上形成 β-loop clamp的灵活性。242的脯氨酸(P)是这的loop的基础,相较于丙氨酸(A)和甘氨酸(G),脯氨酸作为支柱更加牢固。
野生型Tn5转座酶是一种活性极低的蛋白质。这是因为要在宿主的生存和转座之间保持平衡。过多的转座将会导致基因功能的丢失。
YREK motif: 是 IS4 家族的主要标志之一。Y-(2)-R-(3)-E-(6)-K 位于 C1区域(DDE motif 谷氨酸 (E) 所在区域)。
DDE motif: D(60~110) D (100~150)E。
Tn5转座过程
组装过程是二聚体化的,双链DNA与转座酶的两个蛋白质亚基结合,引导转座子末端进入活性位点。[3]
酶与转座子结合→DNA切割 →目标捕获和链转移→分离与修复
1. 结合
由于没有明确的证据,结合过程可以 1)如图中所示,两个单分子Tnp分别与末端DNA结合,然后两个单分子再形成二聚体;2)亦或者是二聚体Tnp先与一端末端结合,再与另一末端结合;3)又或者是两种情况同时发生。
- 结合的第一步必须包括Tnp的C端与N端分离;
- 随后Tnp与末端DNA结合:Tnp的 26-65 的残基与DNA 6-17 号位结合,大部分的结合位 '顺式' ,并且这个顺式结合有可包括342,344 和348残基;
- 接下来Tnp与末端DNA形成二聚化复合物:2个Tnp C端的α螺旋交叉而形成蛋白质-蛋白质结合。末端DNA 1-9 号位插入搭档单体Tnp的活性位点形成 '反式' Tnp-DNA结合,并靠近DDE区域。反式DNA结合十分重要,由于接下来所有的催化步骤都是反式的。
2. DNA切割
该阶段包括三个催化步骤:3'链断裂,发卡结构的形成和发卡结构的断裂。
Tnp的活性位点DDE残基配位两个Mg++,这两个Mg++作为亲核试剂激活氧原子,使氧原子切断P-O键。
- 首先,来自水分子的氧原子作为亲核试剂使两个末端转移链(transferred strand)的3'端断裂。
- 第二步,来自3'转移链的3'OH基团攻击非转移链(non-transferred strand)的5'端形成发卡结构。发卡结构使得转座子DNA从供体DNA中脱离。
- 5'非转移链发生了一些移动,使得发卡结构的断裂,并为目标DNA的接入腾出空间。
3. 目标捕获和链转移
在目标DNA捕获阶段,有一些序列产生偏移。由于两个3'OH基团相距41 Å,要稍远与所攻击的目标DNA两个磷酸二酯键之间9bp的距离。故这两个3'OH基团被镶嵌在一个可以容纳DNA的裂缝中,并且这个裂缝含有许多活性残基。DNA被捕捉到这个裂缝等待链的转移。
等DNA被捕捉后,两个3'OH基团攻击位于目标DNA上相距9bp的磷酸二酯键,完成转座子DNA到目标DNA的转移。在体外时,链转移的两个末端并不同时发生。
4. 分离与修复
体外与体内转座的重大区别体现在链与转座复合物的分离。
在分离后会有两个9bp的缺口在两个末端。
目标DNA最后产生9bp的重复在ATAC-seq后续分析里要处理。这个长度近似于一个完整的DNA螺旋。
References:
[1] Reznikoff W S. Tn5 as a model for understanding DNA transposition[J]. Molecular microbiology, 2003, 47(5): 1199-1206.
[2] De Palmenaer D, Siguier P, Mahillon J. IS 4 family goes genomic[J]. BMC evolutionary biology, 2008, 8(1): 18.
[3] Davies D R, Goryshin I Y, Reznikoff W S, et al. Three-dimensional structure of the Tn5 synaptic complex transposition intermediate[J]. Science, 2000, 289(5476): 77-85.