基本名词
flowcell: 测序反应的载体/容器,1个flowcell有8个lanelane: 测序反应的平行泳道,试剂添加、洗脱等过程的发生位置
tile: 每次荧光扫描的位置,肉眼是看不到的
flowcell构造:一个lane包含两列(swath),每一列有60个tile,每个tile会种下不同的cluster,每个tile在一次循环中会拍照4次(每个碱基一次)
PE:pair-end,双向测序,双端测序,即一个片段,从正向和反向各读一次,2x150bp
SE:single-end,单向测序,单端测序,只读一次,1x150bp
junction: 双端测序中间一些没有测到的区域
Barcode或"Index":区分样本的标签,是一级序列
测序深度:测序得到的碱基总量(bp) 与基因组大小的比值,它是评价测序量的标志之一
测序覆盖度:基因组被测序得到的碱基覆盖的比例
数据量:所测到的碱基总数,1kb=1000bp
Fragment:一个DNA片段
测序原理
-
早期测序,主要为Sanger法,为一代测序
具体原理参考测序的世界
设置四个反应体系1-4,分别加入引物、DNA聚合酶、四种dNTP、一定比例的ddNTP(带有放射性标记的ddATP,ddCTP,ddTTP,ddGTP,分别对应1234体系,其结构中比脱氧核苷酸多脱掉一个氧,即不含羟基,无法在DNA合成过程中形成磷酸二酯键,因此可中断DNA链的继续合成)。假如扩增过程中ddATP遇到了T位点,就结合并终止。因此,最终结合的位点包括dNTP结合和ddNTP结合,但是一段时间内大量的ddNTP会结合完所有测序位点,只是结合次数多少的问题。
最后利用凝胶电泳和放射自显影只能看到带有荧光标记的ddNTP,利用电泳条带前后关系确定其排列顺序,再用A-T, T-A, C-G, G-C关系反转,就能知道测序序列。
由于第一代测序技术测序读长可达1000bp,准确性高达99.999%,故而在验证序列以及验证基因组组装完整性方面都是金标准。
-
二代测序和三代测序
参考和引用摘自生信星球第九期Day7生信入门班教程