1. 整合不同数据集中同一类细胞方法:
该方法来自一篇21年5月份的Nature:Cross-tissue organization of the fibroblast lineage。这篇文章对多个脏器正常和疾病的成纤维细胞进行了整合分析,非常具有参考意义。
整体上采用的是:整合--注释--提取目的细胞群
的方法
可以看到,这篇文献也是使用Harmony做的整合。
注意点:
1. 整合数据集的时候,保留的是在所有数据集中都测到了的基因,未测到的直接去除(这篇里面选的都是10x的数据,没有跨平台)。
2. 作者在做Harmony之前,先使用AddMouduleScore计算了一个stress gene signature
,在做ScaleData的时候对这个评分进行了回归,以消除不同解离方法的影响。
3. 在跑RunHarmony()的时候,把theta参数设为1。这个参数及其他参数的意义见Harmony原理介绍和官网教程
2. 不同脏器的单细胞数据整合
-
猪的多器官单细胞图谱
这篇文章是先做的每个脏器的注释,然后做的整合
3. 不同疾病的数据整合
这篇文献测的是BNT162B2诱导的心肌炎患者病程不同时间点的PBMC。作者将其与新冠患者PBMC(GSE150728,包括7个新冠患者和6个正常对照)、6例注射了新冠疫苗但是没有出现心肌炎的PBMC (GSE171964)、Kawasaki或新冠引起的心肌炎患者的PBMC (GSE167029,包括9个正常对照,6个新冠引起的心肌炎和2个Kawasaki) 进行了整合分析。
整合方法:先锚点整合 (整合数据) 再Harmony (去批次)
参考:锚点整合和Harmony