- 安装工具包:
devtools::install_github('dviraran/xCell')
- 加载该包:
Data input:
表达矩阵应该是基因在行,样本在列的矩阵。行名应该是基因符号。xCell使用的是表达水平排名,而不是实际值,因此归一化没有效果,但需要对基因长度进行归一化。
重要的是,xCell在使用异构数据集时性能最好。因此,建议在一次运行中组合使用所有数据,而不要拆分(尤其不要在不同运行中拆分案例和控制)。
Note1:
xCell生成富集分数,而不是百分比。这不是一种反褶积方法,而是一种富集方法。这意味着它的主要用途是在样本之间进行比较,而不是在细胞类型之间进行比较。xCell尝试使分数类似于百分比,但是这是一个困难的问题,并且非常具体于平台和实验。我们做了一些测试来比较xCell进行跨细胞类型分析的能力,发现它在跨细胞类型分析方面通常比其他方法更好(对有限的和可比较的细胞类型),但这种类型的分析需要谨慎进行。
产生的score千万不要归一化,否则会造成在这个问题上,不可避免的会导致错误的解释。
如果是芯片数据,直接输入表达矩阵即可log之后的
如果是RNASeq,可以输入count文件
xCell <- xCellAnalysis(outTab)
## 如果是RNA-seq数据,则
xCell_RNAseq <- xCellAnalysis(exprSet,rnaseq = T)