2018年10月5日,来自美国斯坦福大学、陈-扎克伯格生物中心(Chan Zuckerberg Biohub),弗吉尼亚州帕洛阿尔托医疗保健系统和加州大学的一个庞大的研究团队组建了一个名为Tabula Muris (Mouse Atlas)的小鼠细胞信息的开源数据库。在他们发表在Nature期刊上的标题为“Single-cell transcriptomics of 20 mouse organs creates a Tabula Muris”的论文中,该团队描述了如何获得这种数据库中的信息以及如何使用它。
这篇文章中,作者对3月大(10-15w)的3只雌性和4只雄性C57BL/6JN小鼠的20个器官进行了单细胞测序,得到了100605个细胞(Fig 1A:)。
考虑到任何一种单细胞测序方法只能提供关于生物体内细胞类型多样性和每个细胞类型内基因表达的部分观点,该研究采用了两种单细胞测序策略:基于微流控液滴的3'测序(得到更多的细胞)和基于流式分选的全场转录组测序(更高敏感度和全面的得到细胞类型)
1. Defining organ-specific cell types
本研究丰富了在一些器官和组织中新的细胞类型的特征基因表达谱,比如成年胰腺中Neurog3、Hhex和Prss53基因,下肢肌肉中Chodl基因等等可能具有新的作用。
2. Methodological comparison
FACS方法得到44949个细胞,微流控测的55656个细胞。
FACS方法平均测得814,488 reads per cell,微流控方法平均测得7709 UMI per cell。(两个方法测到的基因数都是非常多的)
此外,两种方法得到的细胞,都是内皮和白细胞最多。
为了了解本研究采用的FACS法和微流体法两种方法的技术偏差以及对试验的影响,作者纳入了第三种方法microwell测序,并将三者进行比较,结果发现在不同的器官中采用不同方法检测到每个细胞的基因数存在差异。在膀胱、肝脏、肺、乳腺、气管、舌头和脾脏中,FACS法检测到的每个细胞的基因数量几乎是微流体法的两倍,而在心脏和骨髓中数量几乎相当(a)。这种差异可能与测序深度无关,因为FACS和微流体液滴库都接近饱和(b)。
通过分析脾脏和肾脏两个未进行标记分选的器官,可以比较不同方法间不同细胞类型的数量和相对丰度。结果发现,两种方法捕获的细胞类型各占比相等(Pearson相关系数分别为脾:0.99;肾脏:0.99)。尽管如此,微液滴法还是识别了两个器官中FACS法遗漏的细胞类型,譬如肾系膜细胞,脾树突细胞和自然杀伤细胞,这可能与是细胞丰度和采样深度有关,也可能是由于不同方法之间的细胞捕获和裂解偏差。由于FACS法捕获的细胞更少,但每个细胞鉴定到的分子比微流体法多,本研究试图探究这两种方法在33个共享细胞群的大基因表达谱上是否一致。结果发现,这些基因表达谱之间相关性较高(Pearson相关系数:0.74-0.90),这表明尽管方法之间存在偏差,但两者都准确地概括了平均细胞类型基因表达谱。
3. Global clustering across organs
对所有细胞进行聚类,得到54个cluster,注释得到25个细胞群。
和预期的一致,不同组织的器官常常混合在一起。54个cluster中有25个包含了不同器官的至少五个细胞。比如cluster 3和48都包含了超过五种器官的内皮细胞,cluster 1和24包含了至少4个器官的基质和间质细胞。cluster 2包含了来自脂肪,骨骼肌,肺,脾脏,骨髓和肝脏的b细胞,以及胸腺,心脏和骨骼肌的白细胞和淋巴细胞。这提示细胞类型对被检测到基因表达的影响强于样品处理或解离方案的差异。
This suggests that the effect of cell type on measured gene expression is stronger than the effect of batch or dissociation protocol.
随后作者以T细胞为演示,做了进一步的分析。
聚类得到5个cluster,根据marker基因做了一下注释。cluster 0包含那些经历VDJ重排的胸腺细胞,而cluster 2包含那些表达IL2受体的非胸腺T细胞,表明它们被激活。
4. Global transcription factor analysis
定义细胞类型的一个主要目标是去理解细胞间的潜在调节网络。
Fig 5A:作者使用了数据中检测到的1016个转录因子,通过对每个细胞群这些转录因子的基因表达矩阵进行相关性聚类,探究了how transcription factors contribute to cell-type identity。
结果和使用所有基因做聚类得到的树状图(Extended Data Fig. 10a)差别不大,提示表明转录因子表达可以大致定义细胞类型。而在用细胞表面标志物或RNA剪接因子来重复此分析时,发现情况并非如此,表明转录因子能够更好地确定细胞类型。
Fig 5B-E:随后作者通过器官之间的共有细胞类型的相关性分析计算了器官特有的转录因子
Fig 5F:为了探究哪种转录因子对注释细胞类型最有帮助,作者通过随机森林模型进行了变量选择,得到同时定义不同脏器所有细胞类型的136个转录因子。
Fig 5G-I:随后作者定义了可以区分某个细胞类型和其他细胞的转录因子集,结果发现,对于某些细胞类型,如肝细胞、卫星细胞和少突胶质细胞,其中某些重编程因子是区分细胞类型的首要变量(2-813)
综上,通过利用小鼠的转录组图谱有助于发现新的细胞类型,发现已知细胞类型中的新的基因表达,以及比较不同器官细胞类型。考虑到3个月大的小鼠与20岁人类有一定相似的生物特征,Tabula Muris数据库也可以当成健康青年器官的参考,可作为当前和未来疾病小鼠模型的基线。
Tabula Muris网站
打开主页首先看到的是简介。随后Code,可以在github进行下载,用于注释单元格,产生论文中所有图形的代码。
在Data下用户点击“figshare”按钮即可进入数据下载页面。
然后是网站的核心功能区:Visualiation
Visualiation功能区,使用无偏聚类和标记基因表达来识别每个器官中的细胞类型,从而详细描述了每只小鼠的细胞多样性。每个器官中每种细胞类型的基因表达都可以使用下面的互动图解显示。
新文章
20年7月份,Tabula Muris背后的科研团队通过对小鼠的17个器官组织在10个不同时间节点进行RNA测序和血浆蛋白质组分析,建立了小鼠衰老细胞图谱,为衰老过程的研究提供了高时空分辨率的基因表达图谱数据库,文章发表在nature上。
对这篇文章数据进行挖掘的文章发在elife上