参考:
https://www.bilibili.com/video/BV1XJ411r7bJ/?spm_id_from=333.788.videocard.0
定义
而转录组测序即是利用高通量测序技术,将细胞或组织中的全部或部分mRNA, miRNA, lnc RNA 进行测序分析的技术。
RNA-seq 应用
通过RNA-seq,也就是转录组测序,可以帮助我们了解各种比较条件下所有基因的表达差异包括:
正常组织与肿瘤组织;
药物治疗前后的表达差异;
发育过程中,不同发育阶段,不同组织的表达差异……
不仅可以检测,RNA 表达的差异,还有RNA 结构的差异。
转录组的主要目的之一便是寻找 基因表达的差异
。
测序方法(Truseq-RNA)
原始RNA样本清理
由于获取的RNA 大部分都是rRNA,只有2%, 3% 是mRNA 及其余的lncRNA, tRNA, miRNA 等。
因此主要用于RNA-seq 测定的mRNA 只占了很小的比例。而获得的大部分的RNA,tRNA 在各个物种和组织中是非常保守的,如果不是特别测定,一般不会得到什么有效信息。
RNA 建库过程
介绍illumina 的Truseq-RNA 建库方法。
1)杂交
利用真核生物mRNA 尾部PolyA 修饰的特性,进行杂交。
2)打成短序列
将磁珠回收,也就筛选出了mRNA,再对这些片段洗脱,并打成短片段。
3)逆转录
将短片段的RNA 进行逆转录,获得第一链cDNA。
4)合成双链
利用引物合成双链cDNA。
5)连接接头与扩增
到这一步,就和一般的基因测序一样了。
再进行扩增,也就建立了标准的测序文库。
接着就可以拿去测序了。
RNA 质量要求
RNA 必须要有比较高质量,因为开始的杂交是连接3' 的序列,因此如果mRNA 发生了降解,则远离3' 端的序列就很容易被洗脱掉了。
质量检测
根据两个峰的质量进行打分(RIN
值,最高10分,建议8分以上),通常来说这两个峰值越高越尖,打分越高,质量也越高。
数据分析
比对
将测序数据比对到基因组上。
质量控制
通常通过检测比对后的RNA 分布进行判断。
检测RNA 片段有多少在3' 位置,又有多少在5' 位置。
如果左边显著不如右边饱满,则可能大部分的mRNA 发生了降解。
RPKM值(标准化处理)
具体计算参考:https://www.yuque.com/mugpeng/nwmnq7/cf7lm6
本质上就是一个数值的标准化处理。
差异分析
火山图对比不同样本的基因表达量对比。横轴反映差异的大小,纵轴反映差异的显著性。
相同差异大小的样本,可能由于其样本统计数的差异,因而造成了显著性的差异(置信程度,结果更可信)。
聚类分析
对基因表达进行分群,可以找出它们的共同或不同特征。
富集分析
可以将差异基因富集到不同功能上,探寻它们的功能特性。
从上到下基因的功能定义越来越精准,颜色越深,其富集程度越高。
通路分析
结构变异检测
建议测序数据在10G 以上,以保证测序的覆盖度。
可变剪接
一般人类样本,可以发现5000~20000个可变剪接。
融合基因
融合基因指,某个基因头融合到了其他基因的身体上。