生信星球推荐的资料
测序技术
- 一代测序技术
一代测序技术,也被称为Sanger测序,由一个叫Sanger的人发明的一种测序方式。其利用了双脱氧核苷酸会终止PCR的原理。比如:一条序列为ATCGCTA,我们进行3次的双脱氧核苷酸,第一次加入双脱氧核苷酸A和正常的ATCG那么我们会得到下面两种序列,A、ATCGCTA。那么我们就知道碱基A在序列的第一个碱基和第7个碱基。同理运用双氧核苷酸T和C,就会得整个序列的对应碱基的位置BP信息。进而得到整条序列的ATCG的序列信息。
特点:速度快,但是一次只能测一条单一的序列(所以叫低通量),且最长也就能测1000-1500bp
- 二代测序技术
也称为高通量测序技术。它解决了一代测序只能测一条序列的缺陷,它一次能够同时测很多的序列。当分析一个物种或样本中的所有序列信息时候,就用得上高通量。通过物理或是化学的方式将DNA随机打断成无数的小片段(250-300bp),之后通过建库富集了这些DNA片段。接下来将建完的库放入测序仪中测序,测序仪中有着可以让DNA片段附着的区域,每一个片段都有独立的附着区域,这样测序仪可以一次检测所有附着的DNA序列信息。最后通过生物信息学分析将小片段拼接成长片段。
特点:一次能够测大量的序列,但是片段被限制在了250-300bp,由于是通过序列的重叠区域进行拼接,所以有些序列可能被测了好多次。由于建库中利用了PCR富集序列,因此有一些量少的序列可能无法被大量扩增,造成一些信息的丢失,且PCR中有概率会引入错配碱基
- 三代测序技术
虽然和二代技术一样,一次能测好多序列,但是测序的长度可达到10kb左右,并且不需要PCR富集序列,直接测序,这就解决了信息的丢失,以及碱基错配的问题
特点:依赖DNA聚合酶的活性,且成本很高,目前的错误率在15%-40%,极大地高于二代测序技术的错误率。不过好在三代的错误是完全随机发生的,可以靠覆盖度来纠错(但这要增加测序成本)
测序的技术原理
1.一代测序:双脱氧终止反应法,聚合酶延伸链
2.二代测序:边合成边测序(Sequencing by Synthesis),即通过捕捉新合成的末端的标记来确定DNA的序列:DNA待测文库构建——>Flowcell——>桥式PCR扩增与变性——>测序
3.三代测序:单分子测序,测序过程无需进行PCR扩增:DNA聚合酶和模板结合,用4色荧光标记A,C,G,T这4种碱基(即是dNTP)。在碱基的配对阶段,不同的碱基加入,会发出不同的光,根据光的波长与峰值可判断进入的碱基类型。
测序的类型
1..基因组学(核酸序列分析)
(1)全基因组测序(WGS)
(2)全外显子组测序(WES)
(3)简化基因组测序(RRGS)
①RAD-Seq
②GBS
③2bRAD
④ddGBS(也就是ddRAD)
作用:
(1)基因组作图(遗传图谱、物理图谱、转录本图谱)
(2)核苷酸序列分析
(3)基因定位
(4)基因功能分析
其它:
以全基因组测序为目标的结构基因组学
以基因功能鉴定为目标的功能基因组学
2.转录组学(基因表达分析)
(1)mRNA-Seq
(2)IncRNA-Seq(长链非编码RNA)
(3)sRNA-Seq(主要是miRNA-Seq)
作用:
(1)获得物种或者组织的转录本信息
(2)得到转录本上基因的相关信息,如基因结构功能等
(3)发现新的基因
(4)基因结构优化
(5)发现可变剪切
(6)发现基因融合
(7)基因表达差异分析
3.蛋白质组学
(1)蛋白质组数据处理、蛋白及其修饰鉴定
(2)构建蛋白质数据库、相关软件的开发和应用
(3)蛋白质结构功能预测
(4)蛋白质连锁图
4.代谢组学
(1)代谢物指纹分析
(2)代谢轮廓分析