- 单细胞数据挖掘||Garnett :基于监督学习的细胞注释算法
- 10X 单细胞细胞类型手动定义||Identifying Cell Types with Loupe Cell Browser
- CHETAH: sc-RNA-seq 细胞类型定义工具
- SingleR || 单细胞细胞类型定义工具
- sc-RNA-seq Key issues guide ||重新理解细胞类型
- celaref ||单细胞细胞类型定义工具
- single cell marker 基因数据库
- SuperCT: sc-RNA-seq 单细胞细胞类型定义在线工具
- cellassign:基于Tensorfiow 框架的sc-RNA细胞类型鉴定方法
- sc-Review||Best Practices:聚类与细胞鉴定
- clusterProfiler也能做细胞类型鉴定?
单细胞数据分析中,细胞类型的识别是真正生物学意义开始的地方。前面我们已经介绍了大量的细胞类型鉴定的方法,每种方法都加深了我们对细胞类型的理解。我们知道细胞的分化主要是基因的差异表达才形成了大量的 细胞类型:
这也是为什么一直以来,基于marker的方法无法超越的原因。不管模型构建的多么好,如果某类细胞的特征基因没有高表达,它就很难说是该细胞类型。所以细胞类型的鉴定,我们往往需要每一类细胞的特征基因集。虽然我们有了一个比较大的库:cellmarker。但也因为它的大,给我们带来了许多的不便:marker不特异。
之前我们讲的clusterProfiler也能做细胞类型鉴定?就用富集的方法把给定的基因集富集到cellmarker数据库中,得到基因集可能的细胞类型。
在我们学习GSEA的时候,往往和clusterProfiler对比(二者并不是平行的关系),说GSEA可以自己定义基因集呢。于是,如果在GSEA中有一套可信的celltype及其对应的genelist,我们也可以用GSEA的方法做细胞类型的鉴定呀。于是,MSigDB已经开发出一套初步的细胞识别标记的基因集,这些标记用于主要的正常人类组织的细胞类型。该基因集是通过对单细胞RNA实验中聚类marker整理而得到的。这些基因集的目的是促进细胞类型的鉴定。这个基因集的名字叫:SCSig collection: Signatures of Single Cell Identities
最初包含256个基因,代表了来自胃肠道、胰腺、肾脏、肝脏、免疫系统、视网膜和大脑的细胞类型的初步集合。
我们可以在GSEA的官网找到:
我下载了看了看:
以后我们在做GSEA的时候,就多了一个基因集的选择。突然想到,单细胞数据分析中,要讲故事也是一般也是先从找基因集开始。细胞类型是基因集;炎症因子是基因集;免疫细胞是基因集;配受体也还是基因集,如此等等。
某个通路上下游调节也是基因集,落脚到通路上,开心了吗?