“为了解决在使用TCGA数据做数据分析时各种数据转化问题,话不多说直接看教程,干货满满”
01—研究背景
前段时间,小编给小伙伴们系统的介绍了转录组分析过程中的常用数据格式,如count数据格式、RPKM与FPKM等数据格式以及数据格式之间相互转换的原理。今天小编将用示例进行演示,给小伙伴们解决在使用TCGA数据做数据分析时各种数据转化问题,话不多说直接看教程,干货满满
快跟着小编一起学习一下工具
网址导航
http://sangerbox.com/Tool 点击“TCGA RNA-seq简易转换器”
02—使用方法
功能一:不同数据类型之间的转换
----------
方法1 Count数转为FPKM
1.输入参数选择
2.输入之前与输入之后的文件对比
方法2 FPKM数转为TPM
1. 输入参数选择
2. 输入之前与输入之后的文件对比
功能二:不同数值变换,对表达矩阵中数据进行对数或指数变换,只适用于FPKM和TPM不适用于count数据。
----------
1. 输入参数选择
2. 输入之前与输入之后的文件对比
功能三:提取编码基因、提取lncRNA,能将表达矩阵中的ENSG ID和Symbol相互转化。
----------
方法1
将ENSG ID转化为Symbol,这里的symbol包括编码基因与非编码基因
1.输入参数选择
2.输入之前与输入之后的文件对比
方法2
将ENSG ID转化为指定的编码基因与非编码基因Symbol,如常见的Gene Symbol、lncRNA Symbol等
1.输入参数选择,以提取Gene Symbol
2. 输入之前与输入之后的文件