hello,大家好,又是新的一周,上海的疫情仍然居高不下,太原也开始封城,不知道什么时候才是尽头。时间很快,猝不及防,我们还是好好学习,不负韶华。
今天我们继续分享一下单细胞和eQTL的联合分析,上一篇关于这个的联合分析在利用10X单细胞eQTL定位确定自身免疫性疾病的细胞类型特异性基因控制,这一篇要分享单细胞联合eQTL揭示细胞类型特异性分子和遗传与lupus的关联,文章在Single-cell RNA-seq reveals cell type–specific molecular and genetic associations to lupus,发表于SCIENCE,非常高,方法涉及多组学,非常值得研究研究。
系统性红斑狼疮(SLE)是一种异质性的自身免疫性疾病,在女性和亚洲、非洲和西班牙血统的人中发病率较高。bulk转录组分析表明,1型干扰素信号的增加、淋巴细胞激活失调和细胞凋亡清除的失败是这种疾病的标志。许多参与这些过程的基因与系统性红斑狼疮相关的约100个基因位点相接近。尽管取得了这一进展,但对系统性红斑狼疮的循环免疫细胞的全面普查仍然是不完整的,对介导遗传关联的细胞类型和背景的注释仍然具有挑战性。
之前,流式细胞仪和bulk转录组分析被用来分析SLE中循环免疫细胞的组成和基因表达。然而,流式细胞术因其使用有限的已知标志物而会出现偏差,而bulk转录组分析没有足够的能力来检测细胞类型的表达差异。对外周血单核细胞(PBMC)的单细胞RNA测序(scRNA-seq)作为一种全面和无偏差的方法,具有同时分析循环免疫细胞的组成和转录状态的潜力。然而,scRNA-seq在人群队列中的应用受到了样本量、成本和对技术变化的敏感性的限制。为了克服这些限制,来自加州大学旧金山分校等研究机构的研究人员之前开发出多重scRNA-seq(multiplexed scRNA-seq, mux-seq),以实现对人群队列的系统性和经济性scRNA-seq测序。
文章中,研究人员使用多重单细胞RNA测序 (mux-seq) 分析了超过 120 万个外周血单核细胞(162例,99例对照)。病例表现出单核细胞中1型干扰素刺激基因 (ISG) 的表达升高,与单核细胞ISG表达相关的初始CD4+ T 细胞减少,以及总体限制性细胞毒性GZMH+ CD8+ T细胞的扩增。细胞类型特异性表达特征预测了病例对照状态,并将患者分为两种分子亚型。研究人员整合密集的基因分型数据来绘制细胞类型特异性顺式表达数量性状基因座,并将SLE相关变体与细胞类型特异性表达联系起来。
结果1、Compositional analysis reveals CD4+ T cell lymphopenia in SLE
标准化和批次校正的单细胞转录组图谱的 Louvain 聚类确定了 23 个clusters,它们被分配到 11 种细胞类型:CD14+ 经典和 CD16+ 非经典单核细胞(cM 和 ncM); 常规和浆细胞样树突状细胞(cDC 和 pDC); CD4+ 和 CD8+ T 细胞(CD4 和 CD8); 自然杀伤细胞(NK); B细胞(B); 浆母细胞(PB); 增殖 T 和 NK 细胞 (Prolif); 和祖细胞(Progen)。 均匀流形近似和投影(UMAP)的区域被不同细胞类型的细胞占据,在较小程度上,不同的病例对照状态和血统。 不同的pools和处理批次对细胞的分布没有明显的影响。
首先通过分别比较亚洲和欧洲血统的病例和对照之间 11 种细胞类型的频率来评估 SLE 中细胞组成的变化。相对于control,cases 中最显著的特点是CD4 百分比下降,cM和Prolif百分比上升,未接受治疗的病例(N = 21)表现出与接受治疗的病例相似的成分变化。
接下来评估了 CD4 和 cM 百分比的变化是否是由于任一population的绝对丰度的变化。分析了 UCSF 电子健康记录 (EHR) 全血细胞计数中报告的淋巴细胞和单核细胞丰度。 EHR 中报告的丰度与 mux-seq 的估计丰度高度相关(Pearson Rlympho = 0.97 和 Rmono = 0.87)。将另外 100 例病例与 154 例自我报告的血统、年龄和性别相匹配的对照组进行比较,病例显示淋巴细胞丰度显著降低但单核细胞丰度没有差异。为了评估淋巴细胞减少和 SLE 之间是否存在因果关系,使用基于免疫细胞组成的遗传关联的汇总统计数据进行了基于广义汇总数据的孟德尔随机化。与淋巴细胞丰度相关的变体(blympho→SLE = –0.39,Plympho→SLE < 0.008)而非单核细胞丰度(bmono→SLE = 0.009,Pmono→SLE < 0.92)的中介效应对 SLE 风险呈负相关。反向因果分析未显示 SLE 风险对淋巴细胞减少的影响,尽管不能排除水平多效性的替代解释。
Decrease of circulating naïve CD4+ T cells in SLE
对淋巴细胞再分群发现,相对于对照组,病例中最显著的差异是 CD4Naïve 百分比的降低,亚洲病例的下降幅度明显高于欧洲病例。 未检测到 CD4Naïve 百分比与年龄或治疗之间存在显著关联。 相对于对照组,未接受治疗的病例在 CD4Naïve 百分比方面表现出类似的下降。
Clonal expansion of cytotoxic GZMH+ T cells in SLE
在 CD8+ T 细胞区室中,鉴定了表达 CCR7 (CD8Naïve) 和三个效应记忆亚群的naive细胞,包括表达 KLRB1 和 GZMK (CD8MAIT) 的粘膜相关不变 T 细胞和两个缺乏 KLRB1 表达并表达趋化因子 CCL5 的细胞群,效应分子 PRF1 和衰竭标记 LAG3。 两个非 MAIT clusters可以通过颗粒酶(CD8GZMH、GZMH 和 GZMB;CD8GZMK、GZMK)的表达来区分,并反映了 NK 亚群(NKDim、GZMH 和 GZMB;NKBright、GZMK)。 在 CD8GZMH population中,根据样本子集中的 CD4 表达,6% 是 CD4+CD8– 细胞,这些样本也使用 DNA 偶联抗体进行了分析。 相对于对照组,CD8GZMH 百分比在病例中显著增加,并且在燃烧和未治疗病例中观察到相似的百分比。 此外,观察到病例中 CD8MAIT 百分比降低。
除了淋巴细胞内的频率增加外,CD8GZMH 细胞是一个转录异质population,与对照相比,SLE 病例中细胞毒性、衰竭和 ISG 特征的表达升高。 这些特征的表达与治疗无关。 此外,只有 ISG 特征与年龄呈负相关。 在整个细胞中,细胞毒性和 ISG 特征基因之间以及细胞毒性和耗竭特征基因之间的相关性(平均 RPearson = 0.10)通常较低。 因此,在某些情况下,这些途径不太可能在同一细胞中共同激活。 这与通过来自不同个体的 CD8GZMH 假体表达谱计算的特征基因之间的高度相关性形成鲜明对比,突出了体分析在揭示看似同质群体中的额外异质性方面的局限性。
为了进一步研究 CD8GZMH 和 CD8GZMK population的克隆性,对 T 细胞受体 (TCR) 的 CDR3 区域进行了扩增和测序,从 10.2% 的 CD4 和 8.7% 的 CD8 细胞中恢复了成对的 TCRA 和 TCRB 序列,在病例 (N = 83) 和对照 (N = 20) (PWilcoxon = 0.72) 之间检测到的独特 TCR 数量。 在扩增的 CD8 克隆中,59% 来自 CD8GZMH 细胞,21% 来自 CD8GZMK 细胞。 相对于对照组,病例在 CD8 细胞中表现出有限的repertoire,但在 CD4 细胞中没有。 在 CD8GZMH 亚群中,表达细胞毒性特征的细胞与表达 ISG 特征的细胞的比例为~4:1。 作为阳性对照,相对于其他细胞类型,表达不变 TRAV1-2 和 TRAJ33 链的克隆在 CD8MAIT clusters内富集.
Expression changes across 11 peripheral immune cell types in SLE
Transcriptional differences were characterized for each of 11 circulating immune cell types between SLE cases and controls. We found that 302 genes were differentially expressed (DE) in at least one cell type between cases and controls of either Asian or European ancestry, not confounded by medication.Hierarchical clustering of pseudobulk expression profiles of these DE genes across cell types resulted in six modules。相对于对照组,病例上调了所有细胞类型 (Panup) 中的 ISG 模块和包含 IFITM1/3、IFITM3、APOBEC3A、RNASE2 和 IFIT2 的骨髓特异性模块 (Myeup) 的表达。 两个模块都富含 1 型干扰素信号传导和先天免疫途径。 此外,在所有细胞类型中鉴定了一个下调模块,该模块富含淋巴和非淋巴细胞之间的相互作用 (Pandown),一种髓细胞特异性下调模块 (Myedown),富含 Hedgehog 信号,一种 T 细胞特异性上调 富含白细胞活化的调节模块(Tup)和富含AP-1转录反应和Toll样受体信号传导的B细胞特异性上调模块(Bup).
结果通过重组干扰素-b (rIFNB1) 和 SLE 儿科患者体外激活的 PBMC 的单细胞转录组分析得到验证。 对于每种细胞类型,特别是骨髓细胞群,病例和对照之间的表达倍数变化与 rIFNB1 刺激和未刺激细胞之间的倍数变化高度相关。 在先前从bulk分析中确定并在儿科 SLE 中分析的 100 个 ISG 中,64 个在至少一种细胞类型中是 DE,主要位于 Panup (46/79) 和 Myeup (8/64) 模块中。 有趣的是,11 个基因仅在 PBMC 假体中是 DE,说明由于病例和对照之间细胞组成的差异,体积分析可能产生混杂效应。 队列的大样本量导致在成人 SLE 中鉴定出 238 个以前未描述的 DE 基因,其中 56 个是骨髓特异性的。
Pronounced type 1 interferon response in classical monocytes
骨髓细胞在病例和对照之间表现出最多的 DE 基因,包括与 SLE 相关的已知和新基因。 为了进一步研究它们的异质性,将骨髓细胞重新聚集成六个簇,以区分单核细胞谱系(cM、CD14+ 经典;ncM、FCGR3A+ 非经典;ncMcomp、C1QA+/FCGR3A+ 补体表达非经典)和树突细胞谱系(cDC1、CLEC10A+ 常规 1 型) ;cDC2,CLEC9A+ 常规 2 型;pDC,IRF7+ 类浆细胞;)。 尽管 pDC 可以来源于骨髓或淋巴祖细胞,但它们的表达谱与其他骨髓群体更相似,因此与其他骨髓群体进行了联合分析。 还在 cDC1s 和 pDCs 中检测到 AXL+ 树突状细胞,这与它们作为 cDCs 和 pDCs 之间的过渡群体的建议分布一致。 作为骨髓细胞相对于对照组的百分比,病例表现出 pDC、cDC1 和 cDC2 百分比降低,cMs 和 ncMcomps 百分比增加.
接下来,使用 RNA 速度来评估每种骨髓细胞类型沿推断激活轨迹的转录异质性。 在 cMs、ncMs 和 ncMcomps 中,DE 基因的速率分析显示,推断的激活很大程度上反映了平均 ISG 表达的程度,高激活区域富含 SLE 病例的细胞。 这些结果在 cDC 人群中是相似的。 沿着推断的激活排序 cM 表明,使用临床特征定义的具有较高 SLE 疾病活动指数 (SLEDAI) 的病例具有较高的激活。 与亚洲病例相比,在欧洲 (RPearson = 0.66) 中,平均推断激活与 SLEDAI 的相关性更好。 在具有较低疾病活动度(SLEDAI 介于 0 和 4 之间)的任一血统的患者中观察到广泛的平均推断激活,这表明 SLEDAI 的临床措施并未完全捕捉到 SLE 的分子异质性。
Expression modules enable clinical prediction and patient stratification(分子模块与疾病状态关系的预测,这部分涉及到临床检验,我们以后有时间讨论)
Identification of cell type–specific cis-eQTLs across eight immune cell types
接下来,将数据与基因分型数据相结合,以绘制可能介导 SLE 疾病关联的细胞类型和细胞背景特异性顺式表达数量性状基因座 (cis-eQTL)。在八种最丰富的细胞类型中,线性回归以及对三个队列(92 个 CLUES 欧洲人、98 个 CLUES 亚洲人、46 个 ImmVar 欧洲人)的meta分析确定了 3331 个基因在一种细胞类型中至少具有一个 cis-eQTL,将其称为细胞类型—按细胞类型 cis-eQTLs (CBC-eQTLs)。对基因表达的遗传结构的分析导致对每种细胞类型的平均顺式遗传力的估计范围为 0.03 至 0.09,而对细胞类型的平均顺式遗传相关性 (rG) 范围为 0.25 至 0.75。因为细胞是同时处理的,我们还估计了细胞类型之间的共享残余效应 (rE)(例如,共享的环境和转基因效应),范围从 0.03 到 0.12。 rG 和 rE 的聚类反映了循环免疫细胞类型之间的已知谱系.
rG 和 rE 估计表明,多效遗传和共享残留效应在免疫细胞类型中很常见,这可能会混淆在 CBC-eQTL 中检测细胞类型特异性信号的能力。为了解释多效性,我们将每个细胞类型的表达谱分解为所有细胞类型和八种细胞类型特异性成分的共享成分,然后映射与每个成分相关的 cis-eQTL。鉴定了 535 个具有至少一种细胞类型特异性 cis-eQTL (cs-eQTL) (FDR < 0.05) 和 1207 个共享 cis-eQTL (sh-eQTL) 的基因。 CBC-、sh-和 cseQTL 的效应大小在欧洲和亚洲血统的个体之间相关,这些个体由基因型主成分分开。相对于 CBC-eQTLs,每种细胞类型的 cs-eQTLs 在相同或密切相关的细胞类型中显著且特异性富集染色质可及性区域,这表明分解分析更有可能识别 cis-eQTLs 重叠细胞类型特异性 cis-regulatory elements
Identification and annotation of cell type–specific SLE-associated loci
生活很好,有你更好