BASS:为单细胞分辨率的空间转录组学提供多尺度和多样本分析

空间转录组学研究正在达到单细胞空间分辨率,数据通常来自多个组织切片。《Genome biology》发表了一种计算方法BASS,支持单细胞分辨率空间转录组学的多尺度和多样本分析。BASS在单细胞尺度上进行细胞类型聚类,在组织区域尺度上进行空间结构域检测,这两项任务在贝叶斯层次结构模型框架内同时进行。

BASS是什么?

目前用于细胞类型聚类和空间结构域检测的方法存在两方面的局限性:1)所有现有方法仅执行两个分析任务中的一个,有效地使两个不同解剖尺度的分析相互分离;2)所有现有方法都集中于分析从单个组织切片收集的空间转录组学数据。基于此,开发团队提出了一种新的计算方法BASS,用于多尺度和多样本分析,克服了上述两个限制。

BASS以联合细胞类型聚类和空间结构域检测的形式进行多尺度转录组学分析,这两项分析任务在贝叶斯分层建模框架内同时执行。对于这两种分析,BASS适当考虑了空间相关性结构,并将基因表达信息与空间定位信息无缝集成,以提高其性能。此外,BASS能够进行多样本分析,联合建模多个组织切片/样本,促进跨组织样本的空间转录组学数据整合。

BASS的工作流程


BASS进行多尺度和多样本分析,以便在空间转录组学中进行准确的细胞类型聚类和空间域检测。BASS接受来自多个组织切片的基因表达矩阵和空间位置信息的输入,并在一个分级贝叶斯框架中对这两种信息进行建模。在分析中,BASS将组织上每个细胞的细胞类型标签(c)和空间结构域标签(z)作为潜在/隐藏的变量,并通过一个有效的推理算法推断它们。分析后,BASS提供推断出的细胞类型集群标签、空间结构域标签和每个空间结构域内的细胞类型比例作为输出结果。


BASS的性能测试

开发团队通过对三个数据集的全面模拟和应用来说明BASS准确地揭示大脑皮层和下丘脑的转录组和细胞景观的巨大优势。


 模拟数据

首先,开发团队评估了不同方法在单个组织切片上进行空间结构域检测的性能:在模拟中发现BASS在所有场景中都优于HMRF、BayesSpace和SpaGCN。

接下来,评估了不同方法在单个组织切片上细胞类型聚类的性能:在模拟中发现BASS在所有场景中都优于SC3、Seurat和FICT,当细胞类型在组织上显示空间模式时,BASS优于其他三种方法的优势尤其明显。

在单个组织切片的模拟中比较不同的空间结构域检测和细胞类型聚类方法。


最后评估了BASS在多个组织切片综合分析中的性能:在所有模拟场景中所有三个分析任务(包括空间结构域检测、细胞类型聚类和跨域细胞类型组成估计)的BASS性能随着分析组织切片数量的增加而增加。对于细胞类型聚类,Seurat的性能也随着分析的组织切片数量的增加而增加,而SC3的性能先增加,然后随着组织切片数量增加而降低。与单个组织切片分析类似,当细胞类型在组织上显示出空间模式时,BASS相对于其他方法在细胞类型聚类上的优势尤其明显

多组织切片模拟中不同空间结构域检测和细胞类型聚类方法的比较


除了上述的主要模拟,开发团队还探讨了其他各种因素,包括特定细胞类型/空间结构域的数量、稀有的细胞类型、以及随机排除基因对不同方法性能的影响。


 小鼠内侧前额叶皮层的STARmap数据

首先,开发团队检查了不同方法对空间结构域检测的结果:BASS检测到的四个空间结构域与预期的皮质层高度相似(ARI=0.82)。相比之下,HMRF(ARI=0.57)、BayesSpace(ARI=0.26)和SpaGCN(ARI=0.36)检测到的空间结构域与基本事实基本不匹配,方法的排名与模拟数据中观察到的基本一致。此外,BASS检测到的四个皮质层之间有很好的隔离,它们之间有平滑的边界,而BayesSpace和SpaGCN检测到的皮质层在某种程度上交织在一起。值得一提的是,BASS的多样本综合分析能力进一步提高了用于一个样本分析的同一组织切片上的空间结构域检测精度。此外,与我们在焦点样本中发现的情况类似,BASS在单切片和多切片分析中都准确地捕捉到了其他两个切片的四个空间结构域,比其他方法更准确。这些结果证实了BASS在空间结构域检测和多样本综合分析方面的优越性。

在STARmap数据集中检测空间结构域


接下来检验了不同方法细胞类型聚类的结果:单个组织切片上与模拟一致,BASS实现了准确的细胞类型聚类(ARI=0.44),比Seurat(ARI=0.34)、SC3(ARI=0.37)和FICT(ARI=0.27)更准确;BASS的多样本分析也优于其他两种细胞类型聚类方法(Seurat和SC3)

在STARmap数据集中对细胞类型进行聚类


 小鼠下丘脑的MERFISH数据

首先,开发团队检查了不同方法对空间结构域检测的结果:BASS检测到与基础组织学注释高度相似的主要空间结构域(ARI=0.58)。相比之下,由HMRF(ARI=0.42)、BayesSpace(ARI=0.12)和SpaGCN(ARI=0.19)检测到的空间结构域通常与基本事实不匹配。重要的是,利用BASS对五个相邻空间转录组组织切片进行多样本综合分析,进一步深入了解了下丘脑视前区的结构组织,这是其他方法的单样本分析无法实现的。

检测MERFISH数据集中的空间结构域


接下来检验了不同方法细胞类型聚类的结果:单个组织切片上与模拟一致,BASS实现了准确的细胞类型聚类(ARI=0.46),比Seurat(ARI=0.37)、SC3(ARI=0.35)和FICT(ARI=0.34)更准确。使用BASS的多样本分析产生了与Bregma-0.14的单个切片分析类似的细胞类型聚类准确度(ARI=0.49)。使用Seurat的多样本分析改进了单个切片分析(ARI=0.42),而使用SC3的多样本研究与单个切片分析相比产生了较低的细胞类型聚类性能,这可能是由于其性能随着细胞数量的增加而降低(如前所述,ARI=0.33)。三种方法的多个切片与单个切片分析的比较与模拟结果一致,突出了BASS的优势。

对MERFISH数据集中的细胞类型进行聚类


 人背外侧前额叶皮层的10x Visium数据

在单个切片分析中,BASS检测到与大多数组织切片的基本组织学注释高度相似的主要空间结构域(跨切片的平均ARI=0.48),比HMRF(平均ARI=0.30)、BayesSpace(平均ARI=0.44)和SpaGCN(平均AR1=0.40)更高。重要的是,对来自每个成人供体的四个组织切片的综合分析进一步改进了空间结构域检测(中值ARI=0.51),并在四个切片上产生了一致的空间结构域。用BASS进行的多样本综合分析大大改善了这个特定样本的空间结构域的检测,并产生了与基础注释高度相似的皮质层,而且在所有四个切片中都是一致的(ARI = 0.60)。在其他两组组织切片中也可以进行类似的观察,证实了BASS在非单细胞分辨率空间转录组学中的空间结构域检测和多样本综合分析的性能。

在DLPFC 10x Visium数据集中检测空间结构域


在运行时间和内存使用方面,BASS与其他空间结构域检测方法和细胞类型聚类方法相当。对于典型的10x Visium数据,大约5000个点,BASS需要大约8分钟,并使用2GB内存。此外,BASS的运行时间和内存使用量与数据的样本大小呈线性关系,这使得BASS可扩展到分析成千上万个细胞/点。

尽管BASS、HMRF和BayesSpace都采用了Potts模型,但BASS在Potts模型的基础上引入了额外的分层建模结构,以便进行灵活和有效的空间转录组建模。与HMRF和BayesSpace相比,额外的分层建模结构使BASS能够对空间结构域的组成做出根本性的不同和更有效的假设。BASS在分层建模结构中引入了细胞类型组成作为中间层,以明确地模拟不同细胞类型的不同基因表达。因此,BASS能够将一个空间结构域定义为具有独特细胞类型组成的区域,以更好地捕捉每个空间结构域内的基因表达异质性,并实现更好的性能。此外,BASS根据现有数据推断Potts模型中的空间相互作用参数β,而HMRF和BayesSpace则将该参数改为用户指定的值。BASS中对β的推断也有助于提高其性能。最后,从模型推理的角度来看,尽管BASS和BayesSpace都是基于贝叶斯框架,但BASS使用Swendsen-Wang算法对空间结构域标签进行采样,而BayesSpace使用Gibbs采样算法。Swendsen-Wang算法比Gibbs采样算法有更好的混合率,因此也有助于BASS实现更好的准确性。

在必要的预处理步骤之后,BASS也可以应用于其他空间转录组学技术,例如HDST和Seq-Scope。

BASS在未来有几个重要的扩展。例如开发团队主要侧重于使用基因表达数据作为输入,但注意到BASS建模框架是灵活的,可以很容易地以额外特征输入的形式纳入组织学图像的信息,以进一步提高其性能。另一个例子是用主成分分析(PCA)中归一化基因表达矩阵的低维成分作为BASS的输入,且BASS并不局限于PCA,它可以与其他降维方法配对,以其低维分量作为输入。

此外,BASS检测到的准确的细胞类型和空间结构域可以与许多其他分析工具配对,以进一步改善各种下游应用,揭示更多的生物学见解,例如与SpatialCorr配对,以检测组织区域内或组织区域之间具有协调调节的基因。

BASS 是作为 R 包实现的, BASS 软件以及用于重现本研究中呈现的所有分析结果的代码可在 GitHub 和 Zenodo 上免费获得: 

> https://github.com/zhengli09/BASS

> https://doi.org/10.5281/zenodo.6814510


首发公号国家基因库大数据平台


参考文献

Li Z, Zhou X. BASS: multi-scale and multi-sample analysis enables accurate cell type clustering and spatial domain detection in spatial transcriptomic studies[J]. Genome biology, 2022, 23(1): 1-35.

图片来源于Genome biology官网和参考文献,如有侵权请联系删除。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,968评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,601评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,220评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,416评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,425评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,144评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,432评论 3 401
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,088评论 0 261
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,586评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,028评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,137评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,783评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,343评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,333评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,559评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,595评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,901评论 2 345

推荐阅读更多精彩内容