基本名词
- 测序平台:Hiseq2500,Hiseq X ten
- Flowcell:流动池,用于吸附流动DNA片段的槽 道,包含8条泳道(lane)
- Lane:泳道,可以使用Barcode在单Lane中检测多样本
- Barcode:区分样本的标签,是一级序列
- PE:pair-end,双向测序,双端测序,即一个片段,从正向和反向各读一次,2x150bp
- SE:single-end,单向测序,单端测序,只读一次,1x150bp
- Read:一个读长,又叫读段,是一段碱基序列,Reads是read的集合
- 测序深度:测序得到的碱基总量(bp) 与基因组大小的比值,它是评价测序量的标志之一
- 测序覆盖度:基因组被测序得到的碱基覆盖的比例
- 数据量:所测到的碱基总数,1kb=1000bp
- Fragment:一个DNA片段
学习内容
- 区分一二三代测序
- 二代测序大体流程
- NGS组学分类
- 测序原理
主要为Sanger法(第一代DNA测序技术),即双脱氧核苷酸法。
ddATP,ddTTP,ddGTP,ddCTP都是带有放射性同位素标记的双脱氧核苷酸,分别对应不同的碱基ATGC,由于其结构中比脱氧核苷酸多脱掉一个氧,即不含羟基,无法在DNA合成过程中形成磷酸二酯键,因此可中断DNA链的继续合成。
在测序过程中,将待测样品分为4份,每份改变一种脱氧核苷酸,如将dATP改为ddATP,这样一来,复制过程中将会在原来A的位置终止复制,复制结束后,第一份样品中素有片段皆是以ddATP为终端的不同长度的序列(可在不同位置终止复制),接下来的三份样品同理。最终就能得到长度不同,终端已知的DNA序列。然后通过凝胶电泳和放射自显影确定DNA序列。
- 一二三代测序大概介绍
- 第一代测序:通量低,准确度高,读长1000bp左右,依然作为许多文献测序金标准
第二代测序NGS:主要分为两种测序平台,Illumina测序(reads中等,通量较高,价格最低,但测序质量较差)及454测序(reads较长,较准确,通量较低,成本偏高),Illumina是在Sanger法基础上,边测序变合成,即用4中不同颜色荧光标记的dNTP,当NA聚合酶合成互补链时,每添加一种dNTP就会释放出不同的荧光,根据捕捉的荧光信号并经过特定的计算机软件处理,从而获得待测DNA的序列信息。
- 第三代测序(Single Molecule Real Tme DNA Sequencing):单分子实时DNA测序技术,基于纳米孔的单分子读取计数,无需扩增可快速读取序列。读长非常高,测序速度快,准确度非常高,可直接检测广泛的碱基修饰。
- 第二代测序技术大体流程
- 建立DNA文库:利用超声波把DNA样本打断成200-500bp长的序列片段,同时在其两端加上不同adapter(接头),构建出单链DNA文库
- Flowcell:建立好文库后,文库DNA通过flowcell时会随机附着在其表面的泳道上,且泳道表面有许多接头,能与文库DNA接头相互配对,支持DNA在表面进行桥式PCR扩增
桥式PCR扩增与变形: 桥式PCR以Flowcell表面所固定的接头为模板,进行桥形扩增,如图4.a所示。经过不断的扩增和变性循环,最终每个DNA片段都将在各自的位置上集中成束,每一个束都含有单个DNA模板的很多分拷贝,进行这一过程的目的在于实现将碱基的信号强度放大,以达到测序所需的信号要求。
-
测序:变合成边测序。