帕金森氏症(PD)是一个在全球范围内受到密切关注的疾病。迄今为止,在临床常规中没有可靠的生物标志物。在有神经症状的患者中例行收集脑脊液(CSF),并且其应密切反映PD患者大脑的变化。在此研究中,研究者描述了一个可扩展和灵敏的基于质谱(MS)的蛋白质组学工作流程,用于脑脊液蛋白质组分析。从两个(一共超过200人)独立队列中,他们的工作流程从最少的脑脊液量中重复量化了超过1700个蛋白质。机器学习筛选出了PD患者中OMD、CD44、VGF、PRL和MAN2B1的改变或与临床评分显著相关。他们还发现了在LRRK2 G2019S携带者中存在增强的神经炎症的特征,显示CTSS、PLD4和HLA蛋白水平升高。与研究者之前获得的尿蛋白组的比较显示PD相关的变化有很大的重叠,包括溶酶体蛋白,这为人们更好地理解PD的发病机制开辟了新的途径。
01 文章详情
文章题目:Proteome profiling of cerebrospinal fluid reveals biomarker candidates for Parkinson’s disease
中文题目:脑脊液蛋白质组分析揭示帕金森病的生物标志物候选者
发表时间:2022.06
期刊名称:Cell Reports Medicine
影响因子:16.988
DOI:10.1016/j.xcrm.2022.100661
02 研究思路
脑脊液样品的蛋白质组学特征
研究者分析了来自两个独立队列共215个个体的脑脊液样本,包括113名健康对照(HC)和102名PD患者(第一个队列称HBS队列、第二个队列称LCC队列)。研究者开发了一个基于MS的蛋白质组学工作流程,其使用数据独立采集(DIA)策略对最少数量的脑脊液进行蛋白质组分析(图1A)。研究者应用他们自己的工作流程,探究存在或不存在LRRK2中与疾病相关的G2019S突变的PD患者脑脊液中的蛋白质组变化。与群体特异性杂交文库5418和3167个蛋白质进行匹配,分别得到了HBS和LCC人群的1493和1626个蛋白质,其中共有1300多个蛋白质(图1B)。平均每个脑脊液样本定量1357 (HBS)和1481 (LCC)蛋白组,其中超过70%的样本定量1290 (HBS)和1440 (LCC)蛋白组(图1C、1D)。量化的蛋白质强度跨越了四个数量级(图1E和1F)。仅前10个最丰富的蛋白质就贡献了脑脊液蛋白质组总信号的38%左右,说明了分析的挑战(图1E和1F)。
定量精度和样品质量的评估
研究者为了评估研究中的定量精度,他们通过重复测量汇集的脑脊液样本,研究了他们自动化工作流程的分析内部和分析间的变量。该分析显示,具有13%板内和19%板间变异系数(CVs)的高技术重现性。大约1100人的检测间和检测内CV低于20%,1500人低于50%(图1G)。研究对象之间的个体间生物学变异性要大得多,只有10%的蛋白质CV低于20%(图1G)。这表明他们的检测方法的技术变异性比生物学变异性小得多,这是成功发现CSF中PD特异性蛋白组特征和潜在生物标记物的一个重要前提条件。
不一致的样本收集和处理可能导致系统性偏差,阻碍真正的生物标记物的发现。为了确保脑脊液蛋白的定量变化是由于疾病相关的病理改变,研究者根据先前建立的凝固相关蛋白、血小板和红细胞的质量标记模型来评估所有样本的质量,以确定在分析前处理中存在潜在问题的样本 (图2A和2B)。结果表明:红细胞特异性标记的污染程度在样本间有很高的变异性,可能是由于与血液穿刺相关的污染(图2A及2B)。他们从HBS队列中标记了14个样本(8个PD, 6个HC),从LCC队列中标记了17个样本(4个PD, 13个HC)的红细胞污染,并将其从进一步分析中删除(图2C和2D)。共有182个受试者的蛋白质组符合质量标准并被用于统计分析。他们发现红细胞计数和脑脊液中红细胞特异性蛋白的数量之间没有相关性(图2E)。这解释了为什么最初的高红细胞计数不影响蛋白质组测量。
脑脊液中PD相关的蛋白质组改变和基于机器学习的PD患者和对照组的分类
为了研究PD患者与对照组相比脑脊液蛋白质组的改变,研究者进行了ANCOVA分析。在5%的错误发现率(FDR)下,与HBS对照组相比,在HBS队列PD患者的脑脊液中发现了三种显著调控蛋白(CPM、OMD和RFNG);与LCC对照组相比,在LCC队列PD患者中发现了一种(PRCP)(图3A)。PD患者的骨调节蛋白(OMD)和细胞表面标记蛋白(CD44)蛋白水平均显著升高 (图3B-3E)。随后研究者进行了GO富集分析。结果表明:与对照组相比,PD样品中升高的蛋白质在溶酶体相关功能上富集,进一步支持溶酶体的新作用 (图3F)。由于在两组人群中都存在(但数量很少)普遍改变的蛋白质,研究者将HBS和LCC结合并使用机器学习 (ML)探究PD患者和对照组区别。在每次训练迭代中选择35个最具识别力的用于训练模型的蛋白质,分类器根据它们的特征重要性对它们进行排序(图3G)。其中催乳素(基因名:PRL)是50次训练迭代中最重要的特征。当使用这些特征来训练XGBoost时(一个基于集成树的模型),结合研究者的交叉验证方案,ROC曲线的平均AUC为0.72±0.08。敏感性(PD患者的正确分类率)和特异性(PD阴性患者的正确分类率)分别为67%和66%(图3H)。综上所述,研究者的脑脊液蛋白质组数据与ML算法结合后,对疾病状态进行了分类,更重要的是,确定了几个有前途的PD相关蛋白,为未来的研究开辟了有趣的线索。
致病性LRRK2 G2019S突变对CSF蛋白质组的影响
鉴于LCC队列中携带LRRK2 G2019S突变的受试者数量可观,研究者探索了LRRK2突变状态是否会改变CSF蛋白质组。研究者再次应用以性别、样本采集年龄、研究中心和PD状态为混杂因素的ANCOVAR。FDR在5%时,突变显著改变了HLADRA、HLA-DRB1、HLA-DPA1、CTSS、PLD4、TKT、ITGB2、PRDX3、ITIH5、CNDP1和FAH蛋白的丰度(图4A)。根据样本中识别出的多肽可以区分出HLA-DRB1的两种形式,它们都在LRRK2 G0219S携带者中显著富集。此外,FDR为5%的Student 's t检验证实了突变携带者HLA-DRA、HLA-DRB1和HLA-DPA1的上调(图4A和4B)。在LCC队列中,这些HLA蛋白以及PLD4和CTSS的水平在PD患者中显著升高(图4B-4D)。GO富集分析显示:与野生型(WT)等位基因携带者相比,LRRK2 G2019S携带者脑脊液蛋白组中升高的蛋白质在与免疫和炎症反应相关的条目中得到了富集,进一步支持了增强的炎症反应与PD密切相关(图4E)。研究者最近发现,在两个独立队列中,组织蛋白酶家族的多个成员,包括组织蛋白酶A、B、C、D、H、L、O、S和Z的水平在LRRK2 G2019S携带者的尿液中显著增加。他们也在脑脊液中检测到这些组织蛋白酶,但与仅在尿液中检测到的组织蛋白酶S (CTSS)相比,其显著受突变状态的影响(图4F)。
脑脊液和尿液蛋白质组的整合
研究者在其之前的研究中分析了来自两个独立的横向队列(哥伦比亚和LCC)的235个尿液样本,包括两种类型的对照组、健康人群、LRRK2 G2019S携带者、LRRK2 G2019S突变和无LRRK2 G2019S突变的PD患者,共量化了2365个尿蛋白[2]。随后研究者整合了尿液和脑脊液蛋白质组来确定共调节的蛋白。结果显示:超过1000个蛋白质重叠,对应于两种生物液体中所有已识别蛋白质的36%(图5A)。匹配共同的蛋白质丰度揭示了两种生物液体之间的明确相关性(图5 B)。两种液体中最丰富的蛋白包括ALB,PTGDS,ORM1,SERPINA1,B2M,以及几种载脂蛋白和免疫球蛋白(图5B,右上方的标记蛋白)。将PD患者脑脊液(HBS和LCC)和尿液(哥伦比亚队列)中所有常见蛋白的ANCOVA q值与对照组进行比较,发现有几种蛋白在两种液体中均被调节(图5D和5E)。其中骨调节素(OMD)的水平在PD患者的尿液中也显著升高 (图5F)。接下来,研究者将LCC队列的CSF样本和哥伦比亚组或LCC队列的尿液样本中定量的所有常见蛋白的LRRK2 G2019S与LRRK2 WT进行整合(图5G和5H)。结果显示,组织蛋白酶S在两个矩阵中都以LRRK2状态依赖的方式被调节(图5G和5H)。与LRRK2 WT携带者相比,LRRK2 G2019S携带者脑脊液中的组织蛋白酶S水平更高,哥伦比亚组和LCC组的平均倍数变化分别为1.31 (p值为0.0619)和1.65 (p值为0.0001574)(图5I)。
脑脊液蛋白质组谱与临床评分的相关性表明疾病的严重程度
研究者接下来调查HBS队列中任何蛋白质水平的变化是否与帕金森病统一分级量表(UPDRS)评估的PD病理严重程度相关(图6)。他们发现27种蛋白质与特发性PD患者的UPDRS评分显著相关(图6 A)。在PD患者中呈正相关最高的蛋白包括CHST6,MIF,LYVE1,EFNA1和ADM;呈负相关性最高的蛋白包括POMGNT1,TMEM132A,ADAM22,PAM和ST6GAL2(图6 A)。有趣的是,PD患者与对照组相比,这些蛋白质都没有明显改变。此外,研究者将脑脊液蛋白的相关性得分与他们之前在尿液中得到的相关得分进行了比较。UPDRS III评分的Pearson系数比较(尿液中唯一可用的评分)显示10种蛋白质(APOF、MAN2B2、LYVE1、APLP1、ALDOA、IGF2、SUSD5、CD99、S100A7和VGF)在两个矩阵中系数都高于0.4或低于-0.4(图6B)。其中,VGF与两组数据中的UPDRS III评分均呈显著负相关(图6 C)。总的来说,这项分析表明,PD患者的疾病进展(通过运动功能评估)影响脑脊液和尿液中一组类似的蛋白质。
03 主要结论
研究者应用了一个高度可复制和可扩展的基于MS的蛋白质组学工作流程来对PD患者的脑脊液进行蛋白质组分析。相比于对照组,在PD患者中可以显著观察到蛋白质组的变化,并确定了LRRK2 G2019S携带者特异性的生物标志物。当然研究者还需要分析更大的患者队列进行进一步的研究,去发现更多潜在的生物标志物。接下来研究者需要开发临床和靶向分析来验证生物标志物,然后在临床常规中使用一种测试,以实现早期疾病检测和患者分层。
参考文献:
[1] Karayel O, Virreira Winter S, Padmanabhan S, Kuras YI, Vu DT, Tuncali I, Merchant K, Wills AM, Scherzer CR, Mann M. Proteome profiling of cerebrospinal fluid reveals biomarker candidates for Parkinson's disease. Cell Rep Med. 2022 Jun 21;3(6):100661.
[2] Virreira Winter S, Karayel O, Strauss MT, Padmanabhan S, Surface M, Merchant K, Alcalay RN, Mann M. Urinary proteome profiling for stratifying patients with familial Parkinson's disease. EMBO Mol Med. 2021 Mar 5;13(3):e13257.