本文转自沈梦圆的博客
全外显子测序是啥?转录组测序是啥?转录组测序又是啥?他们之间有什么差别么?傻傻分不清,不用怕,多学习下就会了,下面让我们一起来看看!
1 温基础
测序深度: 指测序得到的总碱基数与待测基因组大小的比值。假设一个基因大小为2M,测序深度为10X,那么获得的总数据量 为20M。
覆盖度: 指测序获得的序列占整个基因组的比例。由于基因组中的高GC、重复序列等复杂结构的存在,测序最终拼接组装 获得的序列往往无法覆盖有所的区域,这部分没有获得的区域就称为Gap。例如一个细菌基因组测序,覆盖度是98 %,那么还有2%的序列区域是没有通过测序获得的。(你想实际测到的内容占想测内容的比例。)
2 理概念
全外显子测序(Exome-seq): 首先外显子组(Exome)是指真核生物基因组中全部外显子区域的总和,包含了蛋白质合成最直接的信息。外显子 组测序(Exome-seq)是利用设计好的探针将坐标已知的全基因组外显子区域的DNA捕捉并富集后,进行高通量测 序的基因组分析方法。 对于人类基因组来说,外显子区域大概占到基因组的1%,大概在30M左右。一般全外显子测序的测序深度 为50X~200X,具体深度依研究目的而定,其个体之间的变异小(在VCF文件上记录着少许差异,一点点)。
转录组测序(RNA-seq): 首先转录组是指在相同环境(或生理条件)下的在一个细胞、或一群细胞中所能转录出的所有RNA的总和,包括信使RNA(mRNA)、核糖体RNA(rRNA)、转运RNA(tRNA)及非编码RNA。转录组测序(RNA-seq)是将提取所要研究的特定类型的RNA,将其反转录成cDNA,利用高通量测序技术获得某一物种特定组织或器官在某一状态下的几乎所有转录本序列信息。对于已知参考基因组的物种,所获得大部分序列是已知的,同时会有一些新的转录本会被检测到,几乎可以忽略;甚至处于不同状态的人,其转录组数据有所不同。因此其主要的研究点——研究随着时空的变化、组织的变化、样本的变化,转录本发生改变。
染色质免疫共沉淀测序(ChIP-seq): 主要用于蛋白质与DNA相互作用研究,采用特异抗体对目的蛋白进行免疫沉淀,分离与目的蛋白结合的基因组DNA片段,对其进行纯化和文库构建,再通过高通量测序的方法,在全基因组范围内寻找目的蛋白的DNA结合位点,从而获得全基因组范围内与组蛋白、转录因子等互作的DNA片段信息。(与外显子测序不一样,不是通过设计好的探针来捕获序列的,而是通过特异的RNApoly酶、组蛋白、转录因子来捕获序列的,蛋白结合在哪里就捕获哪里。每做一次实验,换一个蛋白,所捕获的序列是不一样的。)因此其主要研究点——研究用不同组蛋白、转录因子等不同蛋白来做不同的实验,找出互作的DNA序列的不同。
3 明差异
测序范围的区别: 全外显子测序和转录组测序的测序范围是已知的,均针对基因组的转录区域进行测序,但它们有一定的差异,主要为:(1)使用范围有所不同。外显子组测序只能对已知基因组序列信息的物种进行测序,而转录组测序没有这样的限制。转录组可以对Non-coding RNA等进行测序,而外显子组测序仅限于外显子区域;(2)转录组可以反映特定时刻、特定组织该物种的基因表达情况,而外显子组测序不具备此能力。但是,因为部分基因低表达或组织特异表达,转录组难以获得物种全部外显子的信息,而外显子组测序不受表达情况影响,可均一地获得外显子区域序列信息;(3)从转录组获得的遗传信息可能受到转录后加工的影响而导致与基因组不符,而外显子测序无此影响。 染色质免疫共沉淀的测序范围是不确定的、未知的,研究不同蛋白质,其所捕获DNA序列区域是不同的;
测序深度的区别: 全外显子测序的测序深度在任何一个点是均匀的;转录组测序一定是不均匀的,以外显子为单位的不均匀;染色质免疫共沉淀测序的测序深度也是不均匀的,以每个碱基为单位的不均匀,与实验设计有关;