一代测序:Sanger测序原理
- 简单概述 双脱氧终止反应法,聚合酶延伸链 (由于ddNTP的2’和3’都不含羟基,其在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中断DNA合成反应)
- 设置四个反应体系1-4,分别加入引物、DNA聚合酶、四种dNTP、一定比例的ddNTP(带有放射性标记)例如1中是ddATP,它就负责测定T碱基的位置;
- 之后大批量的核苷酸反反复复的结合,把所有的位点都结合
- 最后利用凝胶电泳和放射自显影只能看到带有荧光标记的ddNTP,先利用电泳条带前后关系确定下他们的排列顺序,再用ATCG关系反转一下
- 优点:准确度很高,99.999%
- 缺点 一代最长能测1000bp,再多了就要重头开始一遍导致成本高;另外它一次只测一条,也就是所谓的通量低。
二代测序NGS步骤与原理(先看必备words,见下)
三平台:Roche公司的454技术、illumina公司的Solexa/Hiseq技术(占主要市场,PE(Pair End双端)测序原理)、ABI公司的SOLID技术
双端测序原理:如下
-
建DNA文库
超声打断,用酶补平为平末端,再在两端加上互补配对的adapter(接头),再通过PCR扩增达到一定浓度,构成单链DNA文库
adapter修饰,图片来自生信星球**
2. 上样
- 步骤:建好的文库中的待测序列→测序就在flowcell进行,在特异的化学试剂作用下,强力随机地附着在lane上,与上面的短序列配对,吸附住冲过来的DNA,再在表面进行桥式PCR扩增
- 注意:
- lane上有哪两种接头:lane上随机分布两种接头,p5‘(与P5互补),P7(与P7'互补)
- 待测序列含有哪两种接头: 自带了p5接头和p7接头
- lane与lane之间一般不会相互影响,也就是说一般不会出现lane1固定的DNA又与lane2结合。
- 序列只能一开始是利用p5接头互补,因为p7接头和lane是一样的
3. 桥式PCR
第一轮扩增模版:flowcell表面固定的序列(模版链),与lane接头配对产生了补成双链,后来强碱试剂作用下两条互补链被分开,模版链被冲走,但是互补链稳固定在lane上。接下来就要对互补链p5‘- p7‘ 进行操作
-
去杂:加入NaOH强碱性溶液使双链DNA变性;模板链会被洗脱
图片补充来自生信星球
-
桥式形成: 加入缓冲溶液,互补链的p7‘和lane上的p7互补(但还是一个lane中的),形成了桥的样子
-
桥式PCR: PCR弯成桥状,一轮桥式扩增一倍
循环: 大约35个循环后,最终每个DNA片段都将在各自的位置上集中成束,称为cluster,这是一群完全相同的序列。目的在于实现放大单一碱基的信号强度,满足后期测序需求
-
解链: 桥式PCR完成后,形成了很多的桥形的互补双链,再次强碱解链。这一次不再进行复制,而是利用一种酶--甲酰胺基嘧啶糖苷酶(Fpg)选择性的切掉lane 上p5‘ 连接的链,只留下了与lane p7连接的链,这就是Forward Strand(正链,相对应的reverse strand 是负链)
4. 测序(边合成变测序)
4①双端测序之Forward Strand
- primer结合到靠近p5的sequencing primer binding site1上(结合第一张图片看),再加入特殊的dNTP(它的3‘ 羟基被叠氮基团替代,每次只能添加一个dNTP;还含有荧- 光基团能激发不同颜色);
- 在dNTP被添加到合成链上后,所有未使用的游离dNTP和DNA聚合酶会被洗脱掉;
- 再加入激发荧光缓冲液,激光激发荧光信号,光学设备记录荧光信号的记录,再转化为测序碱基
- 再加入化学试剂淬灭荧光信号并使dNTP 3’ 叠氮基团变成羟基,这样能继续向下进行再加一个,并且保证这个不再发出荧光。如此重复直至所有链的碱基序列被检测出。得到了Forward Strand序列
-
4② Index测序
index1 primer和链上的index1 互补配对,进行index1的检测,测完后,洗脱产物,得到index1 的序列。之后再桥式,再进行index2的。图片来自生信星球
4③双端测序之Reverse Strand: 洗脱掉index2 产物后,还是一个桥式扩增得到双链,再变性得到原始Forward strand 和 新的Reverse Strand, 除去测完的Forward strand。然后和测Forward一样,也是先连接primer,只是连接的位点是Primer Binding Site2,测完后得到reverse strand序列
二代优点:一个循环就能测定flowcell上成千上万的cluster,这就实现了高通量;illunima一次只添加一个dNTP,确实能够保证准确测量同聚物的长度问题
二代缺点:illumina会限制合成的链的长度(原因在于测序长度越长,杂信号越多)
三代测序
- 单分子实时DNA测序,不需要经过PCR扩增,实现了对每一条DNA分子的单独测序,超长读长(可达二代测序的100倍以上),可直接检测表观修饰
- 目前以Pacific Biosciences公司的SMRT技术和Oxford Nanopore Technologies公司的纳米孔单分子技术为主流
- 特点
缺:准确率低
优:读长长
必备words(需不断更新)
flowcell: 测序反应的载体/容器,1个flowcell有8个lane
lane: 测序反应的平行泳道,试剂添加、洗脱等过程的发生位置
tile: 每次荧光扫描的位置,肉眼是看不到的
双端测序: 可能序列比较长有四五百bp,两边各测120-150bp
junction: 双端测序中间一些没有测到的区域
flowcell构造:一个lane包含两列(swath),每一列有60个tile,每个tile会种下不同的cluster,每个tile在一次循环中会拍照4次(每个碱基一次)
sequence by synthesis, SBS 边合成变测序
同聚物:就是3‘端一个一个加dNTP聚合而成的聚合物,因为还带接头,所以不能直接说成DNA分子
一二三代测序总结与对比(引自生信星球)
二代测序主要平台有:
1.罗氏454公司的GS FLX sequencer
2.Illumina solexa genome analyzer
3.ABI公司的SOLiD sequencer
可以参考的链接
测序的世界(上面内容主要来自此,不理解的看着)
初涉测序
测序技术原理及常用数据格式简介
其他待看
DNA 测序技术的发展:第三代测序法
测序发展史:150年的风雨历程
名词结构化(有关于NGS组学的一些结构,但不太懂)