今儿来了解测序的来龙去脉
一.下面说一下测序技术的来源和特点
(引自:欧易生物https://mp.weixin.qq.com/s/_ZqUcgq-qTDlKXw8NHwsNA)
一代测序技术简介
一代测序技术,也被称为Sanger测序,由一个叫Sanger的人发明的一种测序方式。其利用了双脱氧核苷酸会终止PCR的原理。比如:一条序列为ATCGCTA,我们进行3次的双脱氧核苷酸,第一次加入双脱氧核苷酸A和正常的ATCG那么我们会得到下面两种序列,A、ATCGCTA。那么我们就知道碱基A在序列的第一个碱基和第7个碱基。同理运用双氧核苷酸T和C,就会得整个序列的对应碱基的位置BP信息。进而得到整条序列的ATCG的序列信息。
一代测序的特点:速度快,但是一次只能测一条单一的序列(所以叫低通量),且最长也就能测1000-1500bp。所以被广泛应用在单序列测序上。简单概括就是,一代测序只能测一条长度在1000bp左右的序列
当要多条测序时候,就费劲了,于是二代测序就应运而生
二代测序
二代测序技术,也被称为高通量测序技术。它解决了一代测序只能测一条序列的缺陷。
之所以称其为高通量测序就是因为它一次能够同时测很多的序列。比如,当我们分析一个物种或样本中的所有序列信息时候,就用得上高通量
我们通过物理或是化学的方式将DNA随机打断成无数的小片段(250-300bp),之后通过建库富集了这些DNA片段。接下来将建完的库放入测序仪中测序,测序仪中有着可以让DNA片段附着的区域,每一个片段都有独立的附着区域,这样测序仪可以一次检测所有附着的DNA序列信息。最后通过生物信息学分析将小片段拼接成长片段。
二代测序特点:一次能够测大量的序列,但是片段被限制在了250-300bp,由于是通过序列的重叠区域进行拼接,所以有些序列可能被测了好多次。
由于建库中利用了PCR富集序列,因此有一些量少的序列可能无法被大量扩增,造成一些信息的丢失,且PCR中有概率会引入错配碱基。所以三代测序就这样诞生了。
三代测序
三代测序其实就是对二代测序的一个升级,简单来说就是它同样一次能测好多序列,但是测序的长度达到了10kb左右,并且不需要PCR富集序列,直接测序,这就解决了信息的丢失,以及碱基错配的问题。但目前来说三代测序依然有一定的缺陷:三代测序技术依赖DNA聚合酶的活性,且成本很高,目前的错误率在15%-40%,极大地高于二代测序技术的错误率不过好在三代的错误是完全随机发生的,可以靠覆盖度来纠错(但这要增加测序成本)。
简洁明了举例说一下这三代的特点
任务:做1000张试卷。
一代测序:一个人一次只能做50张试卷,所以他无法做完这1000张。
二代测序:有500个人,每个人一次只能做10张试卷,且每个人随机做这1000张中的10张试卷,最后汇总这500个人做的试卷,去除重复做的把不同的统一起来,这样可以最大限度得完成1000张试卷。
三代测序:有30人,每个人一次能做100张试卷,之后的和二代一样,汇总结果。
二.测序的技术原理
一代测序
核心原理:双脱氧终止反应法,聚合酶延伸链
步骤:
1.添加反应物:分别加入引物、DNA聚合酶、四种dNTP、一定比例的ddNTP(带有荧光标记)(例如ddATP,它就负责测定T碱基的位置)
2.之后大批量的核苷酸反反复复的结合,把所有的位点都结合
3.最后利用凝胶电泳和放射自显影只能看到带有荧光标记的ddNTP,先利用电泳条带前后关系确定下他们的排列顺序
4.再用ATCG关系反转一下,即可得到序列
二代测序(NGS)
第二代测序技术的核心思想是边合成边测序(Sequencing by Synthesis),即通过捕捉新合成的末端的标记来确定DNA的序列
步骤:
(1) DNA待测文库构建
利用超声波把待测的DNA样本打断成小片段,目前除了组装之外和一些其他的特殊要求之外,主要是打断成200-500bp长的序列片段,并在这些小片段的两端添加上不同的接头,构建出单链DNA文库
(2)Flowcell
Flowcell是用于吸附流动DNA片段的槽道,当文库建好后,这些文库中的DNA在通过flowcell的时候会随机附着在flowcell表面的channel上。每个Flowcell有8个channel,每个channel的表面都附有很多接头,这些接头能和建库过程中加在DNA片段两端的接头相互配对(这就是为什么flowcell能吸附建库后的DNA的原因),并能支持DNA在其表面进行桥式PCR的扩增
(3)桥式PCR扩增与变性
桥式PCR以Flowcell表面所固定的接头为模板,进行桥形扩增,如图3.a所示。经过不断的扩增和变性循环,最终每个DNA片段都将在各自的位置上集中成束,每一个束都含有单个DNA模板的很多分拷贝,进行这一过程的目的在于实现将碱基的信号强度放大,以达到测序所需的信号要求。
(4)测序
测序方法采用边合成边测序的方法。向反应体系中同时添加DNA聚合酶、接头引物和带有碱基特异荧光标记的4种dNTP(如同Sanger测序法)。这些dNTP的3’-OH被化学方法所保护,因而每次只能添加一个dNTP。在dNTP被添加到合成链上后,所有未使用的游离dNTP和DNA聚合酶会被洗脱掉。接着,再加入激发荧光所需的缓冲液,用激光激发荧光信号,并有光学设备完成荧光信号的记录,最后利用计算机分析将光学信号转化为测序碱基。
三代测序原理
第三代测序技术与前两代相比,他们最大的特点就是单分子测序,测序过程无需进行PCR扩增。
原理: DNA聚合酶和模板结合,用4色荧光标记A,C,G,T这4种碱基(即是dNTP)。在碱基的配对阶段,不同的碱基加入,会发出不同的光,根据光的波长与峰值可判断进入的碱基类型。
三代测序还可以检测碱基的表观修饰情况
补充知识:
高通量什么意思?
打个比方,一代测序一次测序只能够对1个基因进行测序,而高通量测序能够一次检测几十甚至几百个基因,这就是高通量,同时产生的数据也很巨大,一代测序一次测几百bp,高通量测序一次测几个Gbp
有一点疑惑,三代测序技术,实现了对每一条DNA分子的单独测序,为何物错误率比二代要高?
继续查查