研究背景
越来越多的人认识到肠道微生物群在维持宿主健康及其参与疾病发展中的重要性。肠道微生物群失调与代谢紊乱、自身免疫性疾病和各种胃肠道癌症,特别是结直肠癌有关。此外,新的研究证据表明,肠道微生物群的失调也会导致非胃肠道肿瘤,包括乳腺癌、前列腺癌等。虽然以前的研究主要集中在促炎症的肠道菌群,如大肠杆菌和致癌分子,如Colibactin。值得注意的是,肠道微生物群也可以通过代谢药物或影响宿主的免疫反应来影响癌症治疗。
因此,人们对探索干预措施来调节肠道微生物群作为潜在的癌症治疗方法越来越感兴趣。深度学习方法在宏基因组数据分析中的应用已被证明是识别具有抗感染潜力的抗菌肽(AMPs)的一种有效方法。这一成功表明,类似的功能大分子,如抗癌肽(ACPs),可以从宏基因组数据集中发现。ACPs因其抑制癌症的能力而被公认为是一种有效的疗法。尽管数十年的研究和临床相关性,临床上可用的ACPs的数量仍然有限。近年来,一些研究探索了机器学习在预测ACPs方面的作用。然而,到目前为止,这些研究仅限于计算机分析,还没有得到足够的发展,无法从与肠道微生物组相关的巨大且不断扩大的蛋白质和基因组数据集中识别新的ACPs。在这项研究中,我们通过宏基因组数据集来发现新的ACPs。随后,我们通过对来自多组CRC患者和匹配的健康个体的肠道微生物组数据的差异分析,将识别出的ACPs与癌症表型相关联。该方法有效地从肠道微生物群中发现了新的ACPs。这一方法不仅对扩大结直肠癌的治疗选择具有重要意义,而且对其他类型的癌症也有重要意义。
研究结果
1.ACPs与AMPs在很大程度上重叠
以往的研究根据其作用靶点将ACPs分为两种主要类型:一种是既抑制癌细胞又抑制细菌;另一种则是针对癌细胞、细菌和正常细胞。为了研究已知的ACPs和AMPs之间的关系,我们使用CancerPPD和LAMP2数据库检查了两者之间的关系。CancerPPD数据库目前收集的特异性ACPs有3491个,其中421个ACPs完全由天然氨基酸组成。另一方面,LAMP2数据库主要专注于AMPs,共注释了1327个具有抗癌活性的肽,其中大多数(1297个肽)由天然氨基酸组成。在删除两个数据库之间的重复项后,我们确定了1480个唯一的ACPs。值得注意的是,这些独特的ACPs中有1134个(76.6%)也表现出抗菌活性(图2a),表明ACPs和AMPs之间存在大量重叠。使用为AMPs设计的预测模型,我们成功地从1279个ACPs库中识别出1033个ACPs(检索率达80.77%)。值得注意的是,我们之前关于预测潜在AMPs的工作包含了2349个肽,其中很可能包含一个重要的ACPs子集。这些肽可以通过宏基因组数据分析进一步筛选。
2.基于宏基因组队列分析的pACPs挖掘
为了筛选潜在的多肽,我们使用了宏基因组数据分析,假设多肽丰度和特定表型之间存在显著的关联。例如,在AMPs检测中,假设功能性AMPs与细菌丰度呈负相关。同样,假设ACPs与癌症的存在有关。通过引入第二个“挖掘入口”,这种方法可以潜在地提高从功能分子储存库中发现功能肽的总体成功率。为了实现这一点,我们从GMrepo中收集了与癌症相关的宏基因组数据来进行研究,并选择了六个由结直肠癌患者(CRC)组成的宏基因组队列(图2b)。此外,我们手动筛选了两个独立的队列,结果共有496名结直肠癌患者和509名健康受试者。
为了建立显示CRC患者和健康受试者之间差异分布的多肽集。我们研究了肠道宏基因组中的多肽与CRC数据集中是否存在CRC之间的关联。我们计算了CRC患者组数据集的8个队列中,每个队列中2349个多肽的相对丰度。结果显示,CRC患者组中存在1757个序列。随后,我们分析了不同患者之间多肽丰度的差异,发现有867个在结直肠癌患者组与健康对照组相比显著差异表达的多肽(FDR<0.05)。然后根据组之间的折叠变化对这些多肽进行过滤(图2C)。对315个在两组之间表现出最显著差异的肽进行了优先排序。其中,225个多肽在健康对照组中显著富集。我们进一步从225个相对丰度>2*10⁻⁴的多肽中选择了48个用于随后的实验验证(图2d)。
我们成功地化学合成了40个pACPs,用于体外或体内表征其潜在的抗癌效果。在最初的步骤中,我们使用一组16种不同的癌细胞系对40个pACPs进行了体外初步筛选,其中包括4个人类CRC系(HT29、Caco2、HCT116和CT26)以及12个其他癌症模型。我们特意选择了一组不同的细胞系,以评估不同遗传背景下pACPs的影响。简单地说,癌细胞在特定的培养液中培养,然后用最终浓度为25μM的pACPs处理,最小有效抑制浓度>25μM的多肽被认为是非ACPs。暴露于pACPs后,使用MTT法测量癌细胞的存活率。值得注意的是,40个pACPs中有39个(97.5%)在至少一个细胞系中诱导了至少20%的抑制(图3a)。在验证的pACPs中,31个有效地抑制了1~4个细胞系的增殖,而5个pACPs在超过一半的测试细胞系中表现出显著的增殖抑制作用。因此,我们的方法成功地在不同的癌细胞系中识别出具有非常高抗癌效果的pACPs。
结论
总之,人类肠道微生物组功能分子的鉴定和利用为开发新的治疗药物带来了巨大的希望。在这项研究中,我们的重点是从人类微生物组数据集中发现高效的新型pACPs,并成功地验证了这一点鉴定具有有效抗癌作用的多肽的方法。以前的计算方法主要依赖于基于可用ACPs的预测,但在快速扩展的大型生物数据集中发现的需求越来越大。我们的研究利用现有的数据库来证明已知的ACPs与已知的AMPs在很大程度上是重叠的,通过分析来自结直肠癌患者和健康对照受试者的肠道微生物组数据集,将ACPs的发生与癌症的存在或不存在联系起来,假设真正的ACPs的丰度将与癌症的存在成负相关。通过成熟的AMP预测方法与宏基因组的挖掘技术相结合,研究证实了超过97%的已确定的pACPs(40个中的39个)在体外显示出抗癌作用。此外,新发现的ACPs与已知的ACPs序列同源性很低,其中两种ACP显示出独特的特征和显著的抗癌活性,且无明显的细胞毒性。这一发现突显了多中心挖掘策略的高效性,使我们已经鉴定了数十个新的pACPs,大大扩大了目前已知的ACPs的集合。该方法有效地从肠道微生物群中发现了新的ACPs。这一方法不仅对扩大结直肠癌的治疗选择具有重要意义,而且对其他类型的癌症也有重要意义。
参考文献
Ma Y, Liu X, Zhang X, et al. Efficient Mining of Anticancer Peptides from Gut Metagenome[J]. Advanced Science, 2023: 2300107.