重点
- 将全基因组关联研究 (GWAS) 与分子数量性状位点 (xQTL)(包括背景依赖性 (cd)-xQTL)跨多个组学水平相结合,有助于揭示 GWAS 信号背后的假定因果基因、相关细胞类型和优先基因的可能遗传调控机制。
- 通过将调控元件中精细映射的 GWAS 变体与其靶基因连接起来,高分辨率增强子-基因连接图谱可用于基因优先排序。
- 将 GWAS 数据与生物网络相结合有助于识别疾病相关基因,甚至是那些 GWAS 信号较弱的基因。
- 利用 GWAS 研究结果、扰动诱导的转录组图谱和生物网络的综合方法对于药物再利用具有巨大的潜力。
摘要
背景
全基因组关联研究(GWAS)已经确定了许多与人类特征和疾病相关的遗传位点。然而,查明因果基因仍然是一个挑战,这阻碍了 GWAS 研究结果转化为生物学见解和医学应用。
综述内容
作者们深入概述了用于对 GWAS 位点基因进行优先排序的方法和技术,包括:
(A) 基于基因的关联测试:常见做法是使用 GWAS 汇总统计数据,并辅以参考样本的 LD 信息
(B) 将 GWAS 变异与目标联系起来通过增强子-基因连接图: 如染色体构象捕获技术,通过表观基因组特征之间的关联推断染色质相互作用,接触活动模型,基于 CRISPRi 的增强子筛选
(C) GWAS 和分子数量性状位点 (xQTL) 数据的综合分析:表达QTL(eQTL)、DNA甲基化QTL(mQTL) 、剪接 QTL (sQTL)、染色质可及性 QTL (caQTL) 和蛋白质丰度 QTL (pQTL)。 方法可大致分为三类:全转录组关联研究 (TWAS)、共定位分析和孟德尔随机化 (MR)。
-
(D) 基于网络的优先级来确定基因:彼此相互作用的基因或蛋白质通常参与相似的细胞功能并有助于相关的生物体特征。 方法分类:基于相似性,基于传播的,
作者们还概述了生成上下文相关 xQTL 数据的策略及其在基因优先级排序中的应用。作者们进一步强调了基因优先排序在药物再利用中的潜力。最后,作者们讨论了该领域未来的挑战和机遇。
作者们提出未来需要解决的问题
如何提高基因优先排序方法的精度来区分因果基因和共调控基因?
在对基因优先排序方法进行基准测试时,如何准确定义正(因果)和负(非因果)基因?
如何将 GWAS 与来自不同组学层、组织、细胞类型甚至细胞状态的 xQTL 整合起来进行联合分析?
可以采用哪些策略来研究某些分子表型(例如 RNA 剪接和蛋白质丰度)尚未得到充分探索的 cd-xQTL?
可以使用什么方法来识别 GWAS 位点下的假定因果基因,其中遗传变异对性状的影响是由分子表型的时空依赖性遗传调控介导的?
如何有效整合不同类型的生物网络,得出组合的、具有代表性的网络,用于基于网络的基因优先排序?
如何利用基因优先级数据和相关信息来预测药物靶标在临床试验中的成功率?
如何利用药物靶基因和非预期表型之间的关联来预测和管理不良事件的风险?
自己感兴趣的细节
TWAS 的概念通常是指将转录组中基因的表达水平与感兴趣的性状关联起来的分析。在基因优先排序的背景下,它特指将遗传预测的基因表达水平与性状联系起来的分析
在基因优先排序的背景下,它特指将遗传预测的基因表达水平与性状联系起来的分析。共定位方法中包括监管性状一致性(RTC)方法。
共定位的一项挑战是共同调控,其中多个基因或分子表型相互关联,因为它们受到相同或不同但相关的因果变异的调控。这可能导致基因对性状的相关影响,从而很难查明假定的因果基因。
多性状 COLOC (MOLOC) 是 COLOC 的扩展,它可以同时将 GWAS 摘要数据与来自多个组学层的 xQTL 数据整合,以揭示由于共享因果变异而使 GWAS 信号与一个或多个 xQTL 信号共定位的位点
通过 GWAS 识别的大多数变异都是非编码的,不一定调节最近的基因。 例如,增强子区域的变体通过与启动子处的转录机制相互作用来调节基因表达,可以在距靶基因不同距离处发现
通过评估成对 cCRE 之间染色质可及性或活性的相关性,可以利用表观基因组特征(例如染色质可及性和组蛋白修饰)来识别 cCRE 基因链接
-
GWAS 与细胞 xQTL 数据的整合 (如下图):细胞反卷积方法为利用基因型和大量分子表型数据在传统 xQTL 作图队列中作图 cd-xQTL 提供了一种经济有效的解决方案。相比之下,细胞分选和单细胞技术提供了一种更精确的方法来以更高分辨率绘制 xQTL。虽然 GWAS 与 cd-xQTL 的整合为揭示性状相关基因开辟了一条有希望的途径,但由于不同细胞群体遗传效应的异质性,这些基因可能在大量数据中被掩盖。
对于比较不同方法的基准研究,由于多种原因,目前确定为“因果”的基因组可能会强烈偏向那些最接近 GWAS 峰值的基因