作者,追风少年i
组织是一个有序的统一体,细胞与细胞之间不是割裂的存在,而是存在频繁的相互作用,这种相互作用,是通过配体细胞表达配体,配体作用于受体和受体细胞,从而引起受体细胞的生物学变化。正是因为这种频繁的相互作用,体现了细胞之间的有序统一,以及在受到疾病等外界刺激条件下对这种有序状态的影响和细胞之间交流的变化以应对这些刺激。为了分析细胞之间的相互作用,开发了很多方法,其中CellphoneDB[1]、CellChat[2]、NicheNet[3]最为经典,极大地促进了细胞交流的研究。
细胞通讯导论
多细胞生物是由不同类型的细胞组成的“社会”,而且是一个开放的“社会”,这个“社会”中的每个细胞必须协调他们的行为,为此,细胞建立通讯联络是必须的。如生物体的生长发育、分化、各种组织器官的形成、组织的维持以及各种生理活动的协调,都需要高度精确和高效的细胞间的通讯机制。
细胞之间的相互通讯是一个极其复杂的过程,通常指一个细胞发出的信息通过介质传递到另一个细胞产生相应的反应。细胞通讯中有两个基本概念:细胞信号传导和信号转导,前者强调的产生与细胞间的传送,而信号转导是接受与接收后信号转换的方式途径和结果。细胞有三种通讯方式:第一种通过化学信号分子,这是动物和植物最普遍采用的通讯方式;第二种通过相邻细胞表面分子的粘着;第三种通过细胞与细胞外基质的粘着。
细胞通讯基本过程:①信号分子的合成:一般的细胞都合成信号分子,而内分泌细胞是信号分子的主要来源。②信号分子从信号生成细胞释放到周围环境中:这是一个相当复杂的过程,特别是蛋白质类的信号分子,要经过内膜系统的合成、加工、分选和分泌,最后释放到细胞外。③信号分子向靶细胞运输:运输的方式有很多种,激素类主要是通过血液循环系统运送到靶细胞,而致密组织的信号分析则是释放到周围环境中影响周围的细胞。④靶细胞对信号分子的识别和检测:主要通过位于细胞膜或细胞内受体蛋白的选择性的识别和结合。⑤细胞对细胞外信号进行跨膜转导,产生细胞内信号。⑥细胞内信号作用于效应分子,进行逐步放大的级联反应,引起细胞代谢、生长、基因表达等方面的一系列变化。
细胞完成信号应答之后,要进行信号解除,终止细胞应答,主要是通过对信号分子的修饰、水解或结合等方式降低信号分子的水平和浓度以终止反应。示意图如下:
而细胞之间的通讯,也成为了单细胞数据分析非常重要的一环。
单细胞通讯分析最常用的方法----CellphoneDB[1]
2020年Efremova M[1]等人发表的细胞通讯分析方法CellPhoneDB[1],是单细胞分析细胞通讯最常见的手段,引用率远远高于其他方法,目前已经更新到了3.0版本,可以分析空间转录组的生态位通讯,关于空间转录组的通讯分析放在空间转录组部分分享。
数据库
CellPhoneDB[1]配有详细的受配体数据库,其整合了此前的公共数据库,还会进行手动矫正,以得到更加准确的受配体注释。此外,针对受配体有多个亚基的情况,也进行了注释。下面这张图显示了CellPhoneDB[1]配有的数据库包含多少种分泌蛋白和膜蛋白、蛋白质复合物、受配体关系,以及它们来源于什么数据库。数据库唯一的缺点就是物种是人,小鼠或其他物种进行分析需要做基因转换。
CellPhoneDB[1]推断细胞通讯的原理
CellPhoneDB[1]分析细胞通讯需要两个前提条件----表达矩阵和细胞注释,对于ligand-receptor这个互作关系,计算clusterA里面ligand的表达均值,计算另一个clusterB中receptor的表达均值,二者的均值为MEAN;在随机更换细胞的label之后,依据新的标签,计算“clusterA”里面ligand的表达均值,"clusterB"中receptor的表达均值,再求一个平均值mean,这样的过程重复多次,就可以得到一个mean的分布,即null distribution,但是这里需要注意一个问题,上述讲到的通讯方向是clusterA→clusterB,当研究clusterB→clusterA的时候,即clusterB表达ligand,cluster表达receptor。MEAN在这个分布中所在的位置以及更极端的位置,构成的占比,就是p值(p值的定义)。所以CellPhoneDB推测两种细胞类型之间显著富集的受配体关系,本质上还是基于一个细胞类型里面的受体表达量,以及另一种细胞类型里面的配体表达量。此外,如果某种关系无处不在(在所有细胞类型之间都很明显),则无法识别是否显著。其中配受体在细胞类型中平均值的相乘,为细胞之间的通讯强度。
CellPhoneDB[1]分析的注意事项
(1)当分析的细胞数过多的情况下,会进行下采样分析,只分析1/3的细胞。
(2)当存在复合物的情况下,多亚基考虑表达低的那一个亚基
(3)配受体表达占比到达一定的阈值才会纳入分析,默认是10%。
CellPhoneDB[1]分析的可视化展示
CellPhoneDB内置了可视化展示的方法,文献中的示例如下:
但是这个展示方法有两个问题,1)右边的热图表示细胞类型两两之间的相互作用的数量,但沿着对角线左右是对称的,也就是说A-B与B-A的互作数目是一样的,这显然是不合理的;2)左边是具体受配体对,细胞对的互作气泡图,点的大小表示显著水平,颜色则是The means of the average expression level of interacting molecule 1 in cluster 1 and interacting molecule 2 in cluster 2,而没有说哪一个是受体哪一个是配体。
原因都和CellPhoneDB[1]内置的ligand-receptor互作关系对有关。CellPhoneDB[1]默认的展示方法不区分受体还是配体,对于配受体对gene1-gene2,可以是gene1配体gene2受体,也可以是gene1受体gene2配体,忽略了方向性。具体分析的时候,要注意方向性的问题。
单细胞通讯可视化最“美”的方法----CellChat[1]
异常值影响与CellChat[2]方法改进
在分析细胞通讯的过程中,分析细胞沟通交流强度容易受到异常值的干扰。由于单细胞数据的稀疏性,简单粗暴地采用平均值相乘的方法有欠合理,0值占比较大和异常高的表达值,都会显著影响分析的配受体通讯强度,为了解决这个问题,CellChat采用了4分位值的策略,计算方法如下: