古语云:天下大势,合久必分,分久必合。可见,人类在漫长的文明发展过程中总结出来:合作是提高生产效率最好的办法。而细胞在多细胞生命体形成之初就已经明白了合作的重要性,各种细胞类型各司其职,相互配合共建完善的生命体环境。
人与人在合作时需要语言或者其它形式来进行交流,告诉彼此需要做什么和需要什么。细胞与细胞之间的合作同样需求交流,由细胞因子、膜蛋白等信号构成的“秘语”完成了细胞通讯;而这些“秘语”是如何将细胞串联起来,保证生命体高效、有序的运作,就是细胞通讯研究,或者叫做细胞互作。
细胞通讯研究是困扰了生物学家很久的难题——
(1)“秘语”包含了哪些蛋白质或代谢物?
(2)“秘语”如何准确传达生物信号并发挥作用?
从而出现了很多研究方法,诸如同位素标记、免疫荧光、BioID等追踪信号和显示信号互作的技术。但传统的技术面临的壁垒就是检测通量低,耗时耗力。转录组、蛋白组等高通量方法因为混合的数据模式也并未对细胞通讯研究起到良好的推进作用。而在单细胞转录组测序出现后,单次完成成千上万个细胞级的测序成为可能;和转录组学对于基因的研究类似,高通量测序使得研究基因与基因的互作成为了可能。因此,在高细胞通量、高基因通量和高分辨率的基础上,关于细胞通讯的研究也迎来了新的篇章。
=====细胞通讯=====
在人体中,细胞通讯遍布各处,构成了复杂的调控网络。这些信号交互方式主要有邻接型和扩散型的信号传递方式。
邻接型的传递包含我们所熟知的神经信号传递和抗原呈递。这种信号传递方式的特点是信号传递局限在两个存在典型关联关系的细胞之间。例如膜蛋白的配体-受体直接结合将信息从一个细胞传递到另一个细胞。
免疫细胞信号传递
扩散型的信号传递方式则是以分泌蛋白为主,分泌蛋白经过细胞基质或体液扩散至其他细胞完成细胞通讯,内分泌、旁分泌和自分泌都是典型的扩散型细胞通讯手段。
细胞分泌形式的细胞通讯
此外,因为细胞内级联反应的存在,往往只需要一个分子的信号分子即可完成细胞通讯。这种微量而复杂的网络体系无疑为细胞通讯研究造成了很大的阻碍。而单细胞转录组测序保证了数据是单个细胞的分辨率,同时具备对低丰度基因的检出能力,这为细胞通讯的研究提供了一个良好的基础。
下面是我看的对于细胞通讯总结的比较好的reviewer。美国加利福尼亚大学的研究人员合作在《Nature Reviews Genetics》上发表了一篇名为“Decipheringcell–cell interactions and communication from gene expression”的文章。文中概述了基于RNA的细胞间的相互作用分析的应用,详细介绍了细胞-细胞通讯的数据库、数学模型和计算工具的特点及优缺点,探讨了验证推测的细胞-细胞通讯的方法的机制,讨论细胞间的相互作用分析的挑战和未来的方向。后面我们也会对常见的多种方法进行测试和对比。
多细胞生命依赖于协调的细胞活动,而细胞活动依赖于不同细胞类型和组织的细胞间的相互作用(Cell-Cell-Interactions:CCIs)。CCIs使用多种分子,一些分子支持结构性CCIs,如细胞粘附分子,而配体如激素、生长因子、趋化因子、细胞因子和神经递质介导细胞-细胞通讯(CCC)(下图a)。CCC的信号传递通常是由各种类型的蛋白质相互作用介导的,包括配体-受体、受体-受体和细胞外基质-受体的相互作用。而RNA测序(RNA- seq)数据集更多、更容易获取和更直接地分析细胞间的相互作用。随着转录组学的普遍应用,细胞间相互作用的研究大大加快,主要集中于介导细胞分化信号、组织和器官内细胞类型的相互作用以及免疫应答(下图b)。
接着,作者详细介绍了解释细胞-细胞通讯的数据库、数学模型和计算工具的特点及优缺点。在研究中从基因表达推断CCC(Cell-Cell-Communication)可以采用多种策略(下图),将它们统称为研究CCC的方法,这些策略可以破译任何类型的基于基因产物的CCIs,包括参与细胞间结构相互作用的蛋白质。
蛋白质-蛋白质相互作用(PPIs),特别是配体-受体对,在所有策略中都是破译CCC的中心。大多数研究依赖于文献整理的相互作用蛋白列表,这有助于对结果进行生物学解释。一些蛋白质,如转化生长因子-受体和细胞因子受体,需要多个子单元组装才能实现功能。任何亚基的缺乏表达会阻碍配体和受体的相互作用以及由此产生的通讯。因此,近期的计算工具,如CellPhoneDB, CellChat和ICELLNET,包括多聚蛋白和配体与受体复合物之间的相互作用,考虑亚基的共同表达更好地代表了配体-受体的相互作用。
为了阐明相互作用的细胞使用哪些生物过程进行通信,通常使用同源基因的表达作为得分函数,来估计每对相互作用蛋白的得分(上图a)。这些方法应用的主要假设是,(1)基因表达反映了蛋白丰度,(2)蛋白丰度足以推断PPI强度,忽略了它们结合的必要因素,如翻译后修饰或多亚基复合物装配。通信评分可以是二进制的,也可以是连续的(下图b)。二进制评分更简单,而连续分数能更精确地量化细胞间信号。“表达阈值化”和“差异组合”法对二进制类别量化,而“表达产物”和“表达相关性”法可对连续分数进行量化。
许多工具使用统计方法来确定细胞间通讯,根据数学模型分为四类用于识别配体-受体相互作用,(1)基于差异组合的工具,(2)基于网络的工具,(3)基于表达排列的工具,(4)基于数组的工具。
最后,作者介绍了用于检验预测的细胞-细胞通讯的方法的机制。CCC推断应该被认为是一个数据驱动的产生假设的过程,它会根据所采用的策略导致不同的结果(下图)。因此,验证推断的CCC的机制对于确认与细胞群落表型和行为的关联是至关重要的。
许多研究使用实验方法来验证计算推断的CCC机制。这包括三个层次的实验测试(1)确认被认为参与CCC的蛋白的表达。如通过蛋白质组学、酶联免疫吸附试验、western blot或免疫组化;(2)相邻细胞表达的基因产物之间相互作用的可视化。如通过显微镜结合免疫染色、单分子荧光原位杂交或流式细胞术检测;(3)通过使用相互作用分子的激活剂或抑制剂或细胞的遗传操作进行体内或体外实验来评估CCC介质的功能作用,以观察与预测通信一致的效果。
随着CCIs方法的改进,多组学的整合,多时间点的数据分析,跨物种之间的比较等,都可以进行多层面的验证。
====常见的分析软件===
虽然这些软件在基础思路上很相似,但是数据分析方式的不同也使得每个软件具备各自独有的分析方式。在早期的软件和算法(如PromixID)中,计算方式相对简单,呈现的也只有细胞对的配体-受体关系信息。随着应用的扩展,celltalker形成了定向的细胞网络图,cellphoneDB将复合物、整合素等多种配体-受体互作信息考虑进了细胞通讯研究。而近年发表的NicheNet细化了互作强度分析,CellChat进一步考虑了信号辅助因子在细胞通讯中起到的作用。而CellCall 是一个通过整合细胞内和细胞间信号来推断细胞间通讯网络和内部调节信号的工具包。从软件的进展我们可以看见基于scRNA-seq的细胞通讯研究在逐渐地完备和深化。后面我们也会陆续把测试结果推送出来。
====数据库===
从细胞通讯的受关注程度就知道,配体-受体数据库是肯定不缺的。别的不说,仅cellphoneDB和CellChat两个软件就为了分析建立了两个独立的数据库。cellphoneDB对每一个配对信息进行了命名,并且对配体、受体是否属于复合物、整合蛋白和分泌蛋白进行了精确的标注。CellChatDB进一步将互作信息整合为了pathway信息,以包含更复杂的蛋白质互作网络。
CellChat中有CellChatDB.human和CellChatDB.mouse,另外对应物种都有Secreted Signaling, ECM-Receptor, 和Cell-Cell Contact三种interaction database。其中人的有1939种interaction,老鼠的有2021种。
但是整体的感觉是:对植物不太友好!!!
除此以外,描述蛋白质互作的string数据库也包含了配体-受体信息,在下载的蛋白质互作文件中筛选Experiments的数据即为存在配体-受体关系的蛋白质,这些信息也可输入上一节所述的软件中用于细胞通讯分析。
本文使用 文章同步助手 同步