目前10X空间转录组已经有了很多的意向,但是对于空间转录组的带给我们的位置信息想要告诉我们什么样的结果,仍缺乏引导,如何运用空间转录组,更多需要我们自己的摸索和一些文献带给我们一些思路,今天我们来分享一篇空间转录组文章,Multimodal Analysis of Composition and Spatial Architecture in Human Squamous Cell Carcinoma,今年7月份发布于cell。
摘要
为了定义皮肤鳞状细胞癌(cSCC)的细胞组成和结构,我们将单细胞RNA测序与空间转录组学和来自一系列人cSCCs和匹配的正常皮肤的多重离子束成像相结合。cSCC表现出四个肿瘤亚群,三个概括正常的表皮状态以及一个肿瘤特有的肿瘤特异性角质形成细胞(TSK)群体,其定位于纤维血管利基,单细胞和空间数据映射的配体-受体网络与特定细胞类型的整合,揭示了TSK细胞是细胞间通讯的枢纽,免疫抑制的多种特征被发现,包括T调节细胞(Treg)与CD8 T细胞在间隔肿瘤基质中的共定位。最后,人类肿瘤异种移植物的单细胞表征和体内CRISPR筛选确定了特定的肿瘤亚群富集基因网络在肿瘤发生中的重要作用。这些数据定义了cSCC肿瘤和基质细胞亚群,它们相互作用的空间位点以及它们参与癌症的交流基因网络。
背景
(1)人类恶性肿瘤 ------- 90%是上皮癌 ------- 皮肤鳞状细胞癌(cSCC)具有原型特征,例如组织极性破坏和基底膜浸润,因此可作为原型。
(2)肿瘤异质性,切除癌变部位淋巴结转移,PD-1治疗出现的耐药性等,突出了对于cSCC肿瘤微环境研究的迫切性。
(3)单细胞转录组表征细胞类型,研究耐药性,但是于正常组织相比,单细胞转录组缺少能够识别肿瘤特有的生物学特征和肿瘤空间的异质性!
从思路图上看,作者结合了单细胞,空间等技术,来阐明cSCC的肿瘤微环境,利用了单细胞分辨率高,空间转录组识别空间定位等技术的优势,从多个角度来认知cSCC的肿瘤微环境接下来我们来看一下作者得到的主要结果。
主要结果(1)cSCC的多模式分析
利用单细胞技术对细胞进行聚类
值得注意的地方
一、关于细胞定义,从作者的思路来看,拿到这么多的细胞聚类结果,首先定义大类,作者单细胞拿到5万多个细胞,初次定义仅仅定义了6类,然后再对各个大类有一个小类的划分,思路很值得借鉴。
二、批次效应的理解,作者的样本包括癌症样本和正常样本,不同样本之间的聚类分析得到的结果,是否含有批次效应,作者给出了一定的解答。首先,不同样本的测序深度应当大致相同,差异过大在分析的过程中(主要是normalize这一步),会增大批次效应,得到非生物学的结果。其次,与之前的结果进行比较,all bearing resemblance to subsets from prior solid tumor scRNA-seq studies,研究的一致性也会体现技术的稳定性,我们来看一下作者样本的情况。
从这张图图片可以看出,肿瘤细胞和正常细胞存在明显的区域划分,这里我们就需要注意了,相信很多做单细胞的研究者而言,遇到这样的结果,会认为是批次效应,用一定的生信方法去去除(典型如Seurat,存在过矫正的问题),所以说批次效应的验证,是一个很大的课题。
Taken together,these data provide a representative cellular atlas for cSCC.
主要结果(2)TSK亚群
对正常和肿瘤的上皮细胞分开进行re-clustering,正常细胞分为三种细胞类型,including (1) basal (COL17A1), (2)cycling (MKI67), and (3) differentiating (KRT1) cells,肿瘤样本出现了一个独有的细胞类型TSK,下图可以看出,从相关性分析的结果来看,TSK与其他类型相关性都很低,以此作为一个证据来证明这是一个新的细胞类型。
接下来是对TSK细胞类群的特征性分析:
(1) TSKs表达经典的上皮-间质转化(EMT)markers
(2)Furthermore, TSKs exhibited the highest expression of the Hallmark EMT gene signature(GSVA)
(3)EMT-like TSK cells lacked expression of classic EMT transcription factors (TFs),Therefore, we performed single-cell regulatory network inference and clustering(SCENIC),which nominated AP1 and ETS family members as TFs potentially controlling TSKs。(suggesting high cell state plasticity)。
(4)最后,我们发现基底肿瘤细胞在正常组织中的增殖频率大约是基底细胞的五倍,相反,肿瘤和正常分化的KC在cycling中没有差异,可能反映了终末分化中细胞周期退出的要求,TSK cells cycled the least frequently in tumors (8%), and basal cells were approximately four times more common in tumor than normal cycling cells,总之,这些数据表明cSCC中的表皮分化层次在关键方面失调:(1)无法完全参与分化,(2)基底细胞迅速增殖,以及(3)表达EMT-link基因的TSK亚群的出现。
值得关注的方面
一、对上皮细胞进行re-cluster为什么不把肿瘤和正常细胞全部放在一起呢?作者的做法是分别对正常和肿瘤进行重新聚类,定义之后发现了一群新的类群,大家可以思考一下, 如果换作我们来分析,是不是在整合的道路上一条道走到黑呢?
二、细胞增殖频率是怎么计算的?这里留下这样的疑问,如果感兴趣,可以深入研究一下,后面会给大家一起分享一些见解。
三、新的细胞类型如何识别,如果我们拿到作者给出的结果,是否有胆量把TSK作为一个新的细胞类型定义出来进行后续的全部分析呢?这里就涉及到新的细胞类型如何验证的问题,以作者的结果为例,定义用了marker,有一群无法被识别,如何印证?1、相关性分析,2、通路富集分析的差异,3、TF因子分析(基因表达潜能),这些用法均可以作为我们做分析的可靠思路。
主要结果(3)Spatial Transcriptomics Identifies TSK-Basal Heterogeneity at the Leading Edge
这里的空间转录组作者主要是对一种细胞类型进行空间异质性的研究,让我们来看看空间转录组是如何利用的。
患者中,与肿瘤相关的spot在scRNA-seq中显示了映射到肿瘤KC的基因表达,而免疫或基质基因与邻近肿瘤的基质,未涉及的基质或附件区域相关,与总体组织学cSCC结构一致(那也就是说,空间位置信息首先是用来映射基因表达,表征细胞大类,例如肿瘤,正常组织,这是第一步,也就是说,每个基因空间位置的表达我们可以得到)。这里需要注意的是(如下图),空间spot是进行空间聚类的,这样的做法类似于单细胞的分析,后续会用到这个聚类结果。
第一步:Scoring spots in each section with TSK-signature genes fromscRNA-seq
作者这里对空间spot聚类的结果(cluster),对单细胞识别的TSK的signature genes进行Scoring,发现一个明显有富集作用的cluster(如下图),including the TSK markerMMP10, in each patient。TheseTSK-high clusters were similar across patients(也就是说作者运用的是对空间聚类的富集)
In tumors with clear leading edges, the TSK-adjacent stroma,was enriched
for cancer-associated fibroblast (CAF) and endothelial transcripts, highlighting a fibrovascular niche。(如下图)也就是说,在空间上识别了感兴趣的细胞类型之后,研究其周围的基质细胞的特征,这里要注意对周围细胞(spot)的挑选方法,以此来得到空间位置的相关信息。
超过80%的TSKspot位于肿瘤的前缘(这里可以看到空间的分布,结合之前对肿瘤和正常细胞的识别,突出新的细胞类型的空间特异性),剩下的肿瘤边缘的spot对basal tumor gene有富集效果(也就是说作者很关注tumor和normal交界处的细胞),荧光染色也证明了这一点(COL17A1, a shared tumor basal and TSK marker)。炎性反应和干扰素信号转导基因在非TSK前沿表达(不是位于肿瘤边缘的TSKspot),总的来说,这些数据确定了由TSK和基底肿瘤细胞以及TSK近端纤维血管生境组成的异质cSCC肿瘤边缘(空间位置的反应)。
值得关注的点
(1)空间位置的第一步(对于肿瘤切片),生物学上识别肿瘤区域,这一点对于空间识别非常重要,其他方面可以参考这个例子(如发育)。
(2)第二步,空间spot进行聚类分析,得到cluster的信息之后,单细胞与空间的联系也由此展开,单细胞识别的特有的细胞类群,用空间的cluster去富集该cluster的特异表达基因(如文章的cluster分布),这个时候对于新的细胞类型有了一个空间位置上的直观认识。
(3)第三步,特有细胞类型和肿瘤边界形成的关系,作者专门挑选肿瘤边界的spot进行分析,也就是说,测序和定义结果与染色图片进行关联,发现细胞类型与关注的空间位置的相互关系(例如作者发现TSK组成了肿瘤组织的边界)。
(4)空间位置分布对于TSK细胞亚类的划分,大部分TSK位于肿瘤边界,另外一部分的TSK表达炎性反应和干扰素信号转导基因,体现了空间位置对于细胞亚类的划分(空间位置会出现不同的生物学功能)。
主要结果(4)The Immune Landscape of cSCC
研究肿瘤,免疫分析是永远的话题,无论是免疫治疗还是免疫浸润,对于肿瘤研究而言,极具价值。
首先看这里,对病人2 进行一个空间聚类后,免疫基因的表达主要集中在一个cluster(5),从空间位置上看,cluster5主要位于T细胞转录本出现在炎症边界和免疫相关簇中,接下来,通过分析scRNA-seq中的趋化因子和受体表达来评估肿瘤浸润淋巴细胞的潜在募集机制(如下图)
几种趋化因子受体在重叠的T细胞亚群中高度表达,表明共同聚集并与ST中的共定位一致,免疫这部分文章讲述的很精彩,总结一下重点:
一、免疫的研究需要很强的生物学背景关联,对于免疫细胞类型,我们需要更多的积累(marker gene,相关的配受体等等,所以做免疫研究的人,都很厉害,比如我,哈哈),多看看免疫相关的文献, 对我们很有帮助。
二、免疫浸润是一个永远的话题,但是对免疫起作用的不仅仅是免疫类的细胞,还有很多其他细胞类型在干扰免疫过程,其中主要的分析思路就是相应的配受体对(但是我们需要注意一个问题,相关的配受体对不是现成的,而是需要我们积累,无论是数据库还是实验来源,都需要我们不断学习,不可能直接拿到想要的结果)。配受体对的分类和影响,直接导致了免疫现象。免疫是一个大课题,大家可以认真读一下这一段的研究。
主要结果(5)Single-Cell Spatial Architecture of the Inflammatory TME
以单细胞分辨率剖析TIME的空间组织,这部分结果用到了一项新技术,MIBI(离子束成像),也就是说从单细胞水平来鉴别空间位置信息,我们不作为重点在这里讨论(肿瘤浸润)。
主要结果(6)Mapping Cellular Crosstalk at Leading Edge Niches
整合了scRNA-seq和ST数据集以表征前沿的相邻肿瘤与TME细胞之间的信号传导,TSK参与了广泛的旁分泌和自分泌的相互作用,
预测在前沿调节TME特异性细胞类型特征,与TSK血管利基一致,CAF的重要TSK信号转导是由几个TSK-CAF配体-受体对介导的,包括MMP9-LRP1和TNC-SDC1,另外,TSK可通过配体-受体对PGF-FLT1,PGF-NRP2和EFNB1-EPHB4调节内皮。
相反,内皮细胞和CAF显着共表达NicheNet预测的配体,例如TFPI,FN1和THBS1,与TSK受体匹配(如下图):
NicheNet进一步支持TSK作为类EMT细胞类群,NicheNet预测广泛表达的TGFB1和CAF特异性TGFB3调节TSK。TSK receptors corresponding to additional ligands from TAMs and MDSCs included several integrins, including ITGA3 and ITGB1, highlighting another pathway associated with EMT and epithelial tumor invasion。
为了解决TSK细胞是否通常与TME改变有关,TCGA数据分析由单细胞数据得到的 TME gene signatures,we observed a broad correlation between TSK and CAFs in various tumor types,从基因组和转录组上分析肿瘤相关基因发现,CNV loss 通常转录水平低,接下来,我们寻求是否预测可诱导CAF基因的TSK配体既表现出(1)配体CNV缺失的肿瘤中CAF基因表达降低,(2)配体表达与CAF基因之间的相关性,确实,包括MMP9,TNC,SERPINE2,CALM1和已知的CAF激活物TGFB1在内的几种TSK配体似乎可以诱导人肿瘤中的CAF(如下图)。
临床上也证明了对TSK类群发动治疗可以提高免疫治疗的效果。
需要注意的地方
这部分结果主要是对TSK与肿瘤微环境之间的相互分析,可以看到作者运用了很多的配受体对来对TSK和其他细胞类群的交流进行验证,重点在于这些配受体对是如何筛选的,这需要很强的先验知识。
接下来我们关注一下作者运用到的生信方法:
(1)Seurat聚类:low-resolution clustering was performed using the FindClusters function with resolution 0.1 with the first 15 PCs to generate 12 clusters.然后marker gene识别大类。repeating dimensionality reduction and unsupervised clustering on these smaller groups of cells.For myeloid cell types, clustering at resolution 0.6(高分辨率对cluster进行细分)。这里需要注意的是,不同的细胞类群在重新聚类的时候分辨率的参数是不同的,也就是说,聚类结果是否符合预期需要更多的摸索。注意作者的聚类方式是ICA的方式。
(2)配受体分析,配受体对的挑选。
科研无止境,文献需阅读。