基因克隆

基因克隆（gene cloning）或分子克隆,又称为重组DNA技术，是应用酶学方法，在体外将不同来源的DNA分子通过酶切、连接等操作重新组装成杂合分子，并使之在适当的宿主细胞中进行扩增，形成大量的子代DNA分子的过程。例如,要获得人类基因组中的某个基因，我们就需要借助基因克隆技术，进行目的基因的分离、克隆和扩增。因此，接下来，我就从基因克隆工具和具体的实验流程两方面进行介绍。

基因克隆工具

（1）限制性内切酶

首先介绍的是限制性核酸内切酶，它是细菌的“限制-修饰系统”防御机制的重要一员。限制修饰系统(Restriction-Modification System, R-M system )，即限制酶和甲基化酶系统（图1） [1]。研究者将能识别并切断外来DNA分子的某些部位，使外来DNA失去活性，限制外来噬菌体的繁殖的酶称为限制性核酸内切酶（Restriction endonuclease，RE，简称限制性内切酶或限制酶）。而宿主细菌的DNA通过甲基化酶的甲基化后，DNA的酶切位点被保护起来，不会被限制酶切割。

图1. 细菌的防御机制：“限制-修饰系统”

根据限制性内切酶的结构，识别位点，切割位点等特性可以将RE分成四类（表1）[2]，基因克隆中常用的是II型限制性内切酶。不过像IV型内切酶这种可以识别修饰化DNA，可以用于表观遗传学的研究。

表1.限制性内切酶分类[2]

II型限制性内切酶是目前发现的最多的一类内切酶，根据其识别位点与切割位点的特性又可以分成不同的亚型[3]，例如我们常见的识别回文序列的内切酶，EcoR I，属于Type IIP类型，这种酶的切割位点在识别位点内部；而像现在在CRISPR/Cas9相关基因克隆中用到的Bpi I等酶，则属于Type IIS型，它的切割位点离识别位点有几个到几十个碱基的距离。

图2. II型限制性内切酶分类[3]

既然是限制性内切酶，那么酶切DNA后就会留下不同的末端类型，这其中就包括粘性末端和平末端（图3）。所谓的粘性末端，就是酶切后有5’端或者3’端有突出碱基的末端类型，因此又分为5’ Overhang end，例如Hind III，和3’ Overhang end，例如Pst I两种。那些酶切后没有突出碱基的就属于平末端类型，例如EcoR V。

图3. 酶切末端类型

DNA碱基之间靠5’, 3’ 磷酸二酯键连接，限制性内切酶切割DNA后，出现的是5’-P 和3’-OH（图4）。

图4.限制性内切酶水解DNA产生5’-P和3’-OH

另外，根据限制性内切酶的功能，其又有同裂酶、异裂酶、同尾酶、可变酶和修饰敏感内切酶等类型（图5）。其中，同裂酶(isoschizomer)，又称异源同工酶，即从不同原核生物中分离出来的不同的Ⅱ型酶，有相同的识别特点和切割位点，例如Age I和BshT I。异裂酶则是指可以识别相同的核苷酸序列，但会在不同的位点切割 DNA，例如Sma I和Xma I。同尾酶(isocaudarmer)指不同来源的酶其识别和切割序列有一定的相关性，作用后能产生相同的粘性末端，例如Age I和Xma I，这一类的酶酶切后的产物可以进行连接，在基因克隆中有着重要的用途。可变酶则指所识别DNA序列中的一个或几个碱基是可变的，并且识别序列往往超过6个碱基对，例如BstE II识别序列为：GGTNACC，其中N为一可变碱基，可以是A/T/C/G四种中的任何一个；而BstN I 的识别序列为CCWGG，其中的W则表示A或者T。修饰敏感内切酶是对DNA修饰（例如甲基化修饰）敏感的限制性内切酶，例如Bcl I对甲基化的识别位点不能切割，但无甲基化的则可以进行切割；Dpn I则刚好相反，有甲基化才能切割。

图5.不同类型限制性内切酶示例

限制性内切酶有那么多种，到底选择那种进行呢？

首先，我们需要进行酶切位点分析，可以使用在线（Sequence Manipulation Suite和analyze-sequence,Addgene）或者本地版（SnapGene）的分析工具进行序列分析。然后结合同裂酶、异裂酶、同尾酶、可变酶特性进行RE选择，并且同时要考虑所选限制性内切酶对修饰敏感性。另外，根据试剂使用中使用的酶的数量，我们将酶切反应可以分为单酶切、双酶切和分步酶切。单酶切：同一个体系进行一种酶切反应；双酶切：同一个体系进行两种酶的酶切反应（针对反应条件一致的限制性内切酶）；分步酶切：样品进行完第一个酶切反应后进行纯化，再进行第二个酶切反应（针对反应条件不一样的限制性内切酶）。明确了以上信息后，我们就可以进行酶切反应了。一个酶切反应涉及样品类型，缓冲液，酶量以及反应温度和反应时间等。这些都可以参考限制性内切酶的产品使用说明进行操作。

（2）DNA连接酶

限制性内切酶负责将DNA切开，DNA连接酶则是用来重新连接DNA的工具。DNA连接酶是一类催化双链DNA中相邻碱基的5’磷酸和3’羟基间磷酸二酯键形成的酶（图6）。因为是双链，所以一般要求连接位点不能出现碱基错配。不过实际应用中，DNA连接酶也会将有少量错配的DNA进行连接。DNA连接酶主要有两种：T4 DNA连接酶（平末端和粘性末端均可连接），大肠杆菌DNA连接酶（只能连接粘性末端）。

图6. DNA连接酶机制

（3）DNA聚合酶

之前我们介绍过PCR聚合酶链式反应，其中使用的就是DNA聚合酶。实际上，DNA聚合酶长具备三种酶活性（图7）：用于新链DNA合成的DNA聚合酶活性，用于错误参入碱基校正的3’-5’核酸外切酶活性，还有5’-3’ 核酸外切酶活性，在DNA复制中用于去除RNA 引物。借助这一活性，可以进行Nick translation，用于标记核苷酸参入等。但并不是每一种DNA聚合酶都这三种酶活性，NEB官网提供了一系列DNA聚合酶及其具备的功能活性（DNA Polymerase Selection Chart-NEB）。

图7.DNA聚合酶的功能活性

根据所使用的DNA聚合酶类型不同，PCR产物的末端有3’-A粘性末端和平末端两种类型。其中Taq DNA polymerase因为缺乏3’-5’ exonuclease活性，其PCR的保真度低，且PCR产物的3’端多一个粘性末端A；而高保真DNA polymerase保留3’-5’ exonuclease活性，有很高的校正活性，其PCR产物为平末端。

图8. PCR产物末端类型

（4）无缝克隆技术

除了上面介绍的用于传统基因克隆中国的相关工具外，研究者开发了新型的基于插入片段和线性化载体的末端进行同源重组的基因克隆技术，即无缝克隆技术（Seamless Cloning），主要包括Gibson Assembly[4]和Getway Clone两种。这里我们重点介绍其中的Gibson Assembly。

Gibson Assembly技术包含了DNA 5' 外切酶(5' Exonuclease)、DNA聚合酶(DNA Polymerase)和DNA连接酶(DNA Ligase)活性的重组酶(assembly enzyme)，通过同源重组的方法可以将一个或多个DNA片段按照预定方向、快速、高效和精确地插入到线性化载体中，并且最终构建的克隆没有任何额外的碱基序列，因此被称作“无缝克隆”。如图9中Gibson Assembly所示，红色和绿色2个片段为需要连接的双链DNA片段，它们末端有相同的15-25个重叠序列（黑色），首先在50℃条件下，T5 exonuclease核酸外切酶降解5’端的一些碱基，形成3’端突出的单链，3’端单链互补退火；然后Phusion高保真聚合酶补上两条单链之间的缺口；最后Taq DNA ligase将相邻的单链切口连接补齐形成完整的DNA双链（图6）。

在Gibson Assembly基础上，研究者开发了TEDA[5]，仅添加T5 exonuclease核酸外切酶同样可以实现重组克隆，它与借助细胞体内的DNA修复机制进行缺损DNA的修复（图6）。

图9.无缝克隆技术原理

（5）工具载体

接下来我们介绍基因克隆中常用的工具载体。按照功能分，载体分为克隆载体和表达载体（表2）。其中克隆载体含有能在原核细胞中复制的元件，用来克隆和扩增基因；表达载体除了具备克隆载体的基本元件外，还具有转录/翻译所必须的DNA順式元件。以下，我们将以SnapGene或addgene分析的载体结构图进行相关功能元件的说明。

表2.载体类型

以pUC19为例，说明克隆载体中的功能元件（图10）。

图10.pUC19载体图示

复制起始位点（Origin of replication，ORI）：ORI是一段DNA序列，质粒复制的起始位置。DNA解螺旋酶可以作用于这段序列，然后DNA的双链被分开，复制随即开始。质粒必须是能够复制的，否则随着细菌的生长，质粒的数量将会被迅速稀释。筛选标记，主要指抗生素抗性基因。在含有抗生素的培养基中培养细菌，能够生长的就是含有目的质粒，因为，不含质粒的细菌已经被“杀死”了，原核中常用的抗性筛选基因有Amp和Kan。LacZ：β-半乳糖苷酶基因，也是一种筛选标记，用于蓝白斑筛选。多克隆位点（multiple cloning site, MCS），这是一段短DNA片段，包括多个限制性酶切的单一位点，便于外源基因的插入。一般来说，外源DNA片段越长，越难插入，越不稳定，转化效率越低。

以pcDNA3.1为例，说明表达载体中的功能元件（图11）。

图11.pcDNA3.1图示

表达载体pcDNA3.1除了有克隆载体相关元件，如复制起始位点Ori，原核筛选标记Amp外，还有一些其他的功能元件，如表3所示。

表3.pcDNA3.1中的功能元件

表达载体主要用于表达蛋白或者RNA，例如现在基因编辑中常用的一个表达载体PX458（图12），可以同时表达Cas9蛋白和sgRNA。因此上面也会携带一些其他的功能元件（表4）。

图12.PX458载体图示

表4.PX458中的功能元件

上面介绍的pcDNA3.1和PX458均是瞬时表达载体并不能在人类等细胞中进行复制，随着细胞的分裂，单个细胞中的质粒不断的被稀释，因此这些载体只能起到瞬时表达的效果。而慢病毒表达载体则可以介导表达元件整合到人类细胞的基因组中，这些表达元件可以随着基因组DNA的复制而复制，因此可以实现稳定表达。

我们常用的慢病毒载体是以HIV-1(人类免疫缺陷I型病毒)为基础发展起来的基因治疗载体，携带有外源基因的慢病毒载体在慢病毒包装质粒、细胞系的辅助下，经过病毒包装成为有感染力的病毒颗粒，将其进行收集和浓缩后可直接感染宿主细胞或者动物模型，将外源基因有效地整合到宿主的染色体上，从而达到外源基因的持久性表达。我们以pGreenPuro为例说明慢病毒表达载体中一些关键的功能元件（图13，表5）。

图13.pGreenPuro载体图示

表5.pGreenPuro功能元件

（6）感受态细胞

感受态细胞是采用理化方法诱导过的细胞，它可以吸收周围环境中的DNA分子。实验室中我们常使用E. coli进行感受态细胞的制备，主要包括克隆用的感受态细胞和表达用的感受态细胞（图14）。

如果仅仅是进行质粒扩增，我们一般使用克隆感受态细胞。如果要进行原核蛋白质表达，我们则选择表达感受态细胞。并且感受态细胞的基因型也有很多类，是通过不同基因的缺失形成的，因而使细胞具有不同的特性，以满足不同的需要。例如，进行克隆载体和瞬转表达载体的扩增，常选用E. coli DH5α，TOP10菌株；而慢病毒载体则一般选择低重组率的E. coli Stbl3菌株。而对于非甲基化载体的扩增，则需要选择E. coli dam-/dcm- 等甲基化酶缺失的菌株。

图14.感受态细胞的转化

2. 基因克隆流程

前面了解了基因克隆使用的相关工具酶和载体，接下来，我们介绍基因克隆的实验流程。细分的话，包括以下10个步骤（表6）。

表6.基因克隆流程

下面我们以lncRNA PVT1的克隆和表达，分别采用T/A克隆，传统酶切-酶连克隆和无缝克隆进行示例。

表7.PVT1的克隆与表达

(1) T/A克隆

T/A克隆是把PCR片段与一个具有3’-T突出的载体DNA连接起来的方法（图15）。使用该方法进行基因克隆时不需要考虑酶切位点问题，但需要选择Taq DNA聚合酶进行PCR扩增，其产物的3’端才会多一个突出的A；此外，T/A克隆选用商业化的T载体，其为线性化的载体，在3’端有一个突出的T；并且基因片段连入T载体是没有方向性的，正反都有可能。

图15.T/A克隆实验流程

我们首先从NCBI上获取PVT1（human）的基因序列信息（https ://www.ncbi.nlm.nih.gov/nuccore/MG562504.1），然后使用SnapGene等进行PCR引物设计（图16）。以PVT1全长序列（1081nt）为模板，设计的引物正向引物的5’端与PVT1序列的5’端相同，反向引物的5’端与PVT1序列的3’端互补。然后使用Taq DNA 聚合酶，以细胞的cDNA为模板进行PCR，产物经琼脂糖凝胶电泳或割胶回收目的大小片段（图17）。

图16. T/A克隆PVT1的引物设计（SnapGene）

图17.DNA电泳与割胶回收

胶回收的基因片段与商业化的T载体（pMD-18T）连接，形成重组DNA载体pMD18-PVT1（图18），经转化（图19）和菌落PCR（图20）后筛选到候选阳性克隆，再使用Sanger测序（图21）进行插入序列的鉴定，获得阳性克隆。

图18.T/A克隆——连接

图19.转化

图20.菌落PCR

图21.Sanger测序

（2）传统酶切-酶连克隆

传统酶切-酶连克隆主要是采用相同的限制性内切酶（或者同尾酶）分别酶切载体和基因片段，然后使用DNA连接酶进行连接，转化。以下，我们同样以PVT1为例，将其使用传统方法克隆至pcDNA3.1表达载体上。

我们在获得PVT1的基因全长序列后，需要首先进行酶切位点分析，例如使用SnapGene进行常用6碱基识别位点的限制性内切酶位点分析（图22）。同时，我们分析pcDNA3.1中MCS中可用的酶切位点，我们排除PVT1有的限制性内切酶并排除同尾酶（避免载体的自连），即可得到可用的限制性内切酶。在这里我们选择Nhe I和EcoR I（图23）。

图22. PVT1酶切位点分析

图23.pcDNA3.1中MCS图示

接下来，我们以PVT1的全长序列为模板设计克隆引物（SnapGene设计的引物序列与T/A克隆中一样），不过我们还要在引物的5’端添加选择好的限制性内切酶的酶切位点以及相应的保护碱基（图24）。同样使用Taq DNA 聚合酶或者其他高保真DNA聚合酶，以细胞的cDNA为模板进行PCR，产物经琼脂糖凝胶电泳或割胶回收目的大小片段。

图24.PVT1引物设计，酶切位点和保护碱基引入

回收的PVT1 PCR产物和pcDNA3.1载体均使用Nhe I和EcoR I进行双酶切，其中PVT1由于酶切后的序列为一个约1000bp的片段和一个约5bp的片段，无需进行割胶回收，直接使用PCR产物纯化柱进行酶切产物纯化即可（图25）。而pcDNA3.1的酶切由于可能存在未完全切开的质粒（在后续转化中会形成大量的假阳性克隆），需要进行琼脂糖凝胶电泳，割取线性化的载体片段进行胶回收（图25）。然后将PVT1和pcDNA3.1酶切片段使用DNA连接酶进行连接，转化。同样，使用菌落PCR和Sanger测序进行阳性克隆子pcDNA3.1-PVT1的筛选（图26）。

图25. PVT1和pcDNA3.1的双酶切

图26.PVT1和pcDNA3.1的连接

（3）无缝克隆

无缝克隆的一个重要优势是不需要考虑待克隆片段中的酶切位点情况，因此直接选择相应的酶切位点将载体线性化后，根据载体的线性化末端进行同源引物的设计，PCR扩增目的基因并纯化后直接进行重组连接和转化（图27）。以下，我们同样以PVT1克隆至pcDNA3.1载体为例进行说明。

图27.无缝克隆实验流程

获得PVT1和pcDNA3.1的全长序列后可以使用SnapGene，CE Design（Vazyme）和In-Fusion Clone（Takara）等在线或本地软件进行同源臂引物的设计。

图28.PVT1的同源臂引物

使用同源臂引物，以细胞cDNA为模板，使用高保真DNA聚合酶为模板进行PCR，胶回收相应片段。pcDNA3.1载体使用Nhe I和EcoR I进行双酶切后，割胶回收载体片段。然后添加无缝克隆试剂进行重组连接，转化后进行阳性克隆的筛选与鉴定。

图29.pcDNA3.1-PVT的无缝克隆

而实际上，无缝克隆还有另外一个重要的优势：可以同时进行多片段的重组克隆，而这对于传统酶切-酶连克隆是一个很大的挑战。基于传统克隆技术可能需要克隆一个片段后，再在特定位置选择酶切位点，插入第二个片段，依次推进，这样不仅实验周期长，并且会在每个片段之间引入了额外的酶切位点碱基序列，可能影响到基因的完整性。不过可以通过融合PCR的方式，设计末端重叠的引物进行各个克隆片段的融合，但长的基因片段的PCR扩增本身也存在着失败率提高的问题（表8）。

表8.无缝克隆与传统克隆的比较

总结

本部分我们主要介绍了基因克隆中使用的工具酶和载体，并以PVT1的克隆和表达载体的构建为例，分别介绍了T/A克隆、传统酶切-酶连克隆和无缝克隆技术的实验流程。

参考文献

1. Vasu,K. and V. Nagaraja,Diverse functions of restriction-modification systems in addition to cellular defense.MicrobiolMol Biol Rev, 2013.77(1): p. 53-72.

2. Loenen, W.A., et al.,Highlights of the DNA cutters: a short history of the restriction enzymes.Nucleic Acids Res, 2014.42(1): p. 3-19.

3. Pingoud, A., G.G. Wilson, and W.Wende,Type II restriction endonucleases--a historical perspective and more.Nucleic Acids Res, 2014.42(12): p. 7489-527.

4. Gibson, D.G., et al.,Enzymatic assembly of DNA molecules up to several hundred kilobases.Nat Methods, 2009.6(5): p. 343-5.

5. Xia, Y., et al.,T5 exonuclease-dependent assembly offers a low-cost method for efficient cloning and site-directed mutagenesis.Nucleic Acids Res, 2019.47(3): p.e15.

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 194,457评论 5赞 459
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 81,837评论 2赞 371
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 141,696评论 0赞 319
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 52,183评论 1赞 263
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 61,057评论 4赞 355
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 46,105评论 1赞 272
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 36,520评论 3赞 381
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 35,211评论 0赞 253
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 39,482评论 1赞 290
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 34,574评论 2赞 309
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 36,353评论 1赞 326
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 32,213评论 3赞 312
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 37,576评论 3赞 298
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 28,897评论 0赞 17
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 30,174评论 1赞 250
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 41,489评论 2赞 341
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 40,683评论 2赞 335

基因克隆

基因克隆工具

推荐阅读更多精彩内容