本周最新文献速递20220522
一、精细解读文献 一
文献题目: Single-nucleus chromatin accessibility profiling highlights regulatory mechanisms of coronary artery disease risk
不想看英文题目: 单细胞染色质可及性分析突出了冠状动脉疾病的调节机制
杂志和影响因子: Nat Genet (IF: 38.33; Q1)
研究意义: 冠状动脉疾病 (CAD)是最常见的心血管疾病,由血管壁损伤和动脉粥样硬化斑块积累引起的疾病。CAD 发病过程涉及多种细胞类型,包括内皮细胞、平滑肌细胞 (SMC)、成纤维细胞和免疫细胞等。全基因组关联研究(GWAS)发现了 200 多个与 CAD 相关的位点,大多数位点位于顺式调节元件 (CRE)中。由于 CRE 通常是在特定的细胞类型中发挥功能, 因此需要在细胞水平上了解 CAD 的调节机制才能充分解释风险位点的功能作用。
结论:
- 作者对 41 名动脉粥样硬化患者的冠状动脉(左前降支、左回旋支或右冠状动脉)进行了 snATAC-seq;
[图片上传失败...(image-de3e22-1653232206886)]
- 总共获得 28,316 个单细胞核,14 个细胞簇;
[图片上传失败...(image-e24420-1653232206886)]
- 根据基因活性评分将 14 个细胞簇映射到不同细胞类型中,映射的细胞类型有:SMC(标记基因 MYOCD , MYH11 , CNN1、TAGLN 和 ACTA2)、内皮细胞(标记基因 CLDN5)、成纤维细胞(标记基因 TCF21、LUM)、巨噬细胞(标记基因 CSF1R)和T细胞/自然杀伤细胞(标记基因 TBX21);
[图片上传失败...(image-d40089-1653232206886)]
- 相比非病变或健康对照样本(17.7 ± 8.3%),动脉粥样硬化和冠脉钙化样本(44.1 ± 18.8%)的免疫细胞比例更高(细胞簇 8-14),这与动脉粥样硬化的疾病进展趋势是一致的;
[图片上传失败...(image-492c40-1653232206886)]
- 基因活性评分还鉴定了 5,121 个表征细胞类型特异性或疾病进展相关的 marker 基因以及 323,727 个细胞类型特异性峰图;
[图片上传失败...(image-d82f82-1653232206886)]
- HOMER 显示 SMC 细胞峰图富集的转录因子(TF)motif 有:MEF2 家族、 TEAD 家族、CArG 盒结合的心肌素/血清反应因子。内皮细胞峰图富集的 TF motif 有 ETS 和 SOX 家族。巨噬细胞峰图富集的 TF motif 有 PU.1/SPIB 和 IRF 。成纤维细胞峰图富集的 TF motif 有 CEBP 和 AP-1 家族。T 细胞峰图富集的 TF motif 有 RUNX 家族。肥大细胞峰图富集的 TF motif 有 GATA 家族;
[图片上传失败...(image-6743d-1653232206886)]
- chromVAR 显示 TCF21 motif 在 SMC 和 纤维肌细胞也高度富集;
[图片上传失败...(image-3d90c7-1653232206886)]
- 对 CAD 和其他心血管疾病表型 GWAS 变异位点进行细胞类型特异性连锁不平衡 (LD) 评分回归 (LDSC)分析。LDSC 表明 CAD 和血压 GWAS 变异位点在 SMC、内皮细胞和巨噬细胞中高度富集;脉压和颈动脉内膜中层厚度的变异位点在 SMC 富集;
[图片上传失败...(image-110b9a-1653232206886)]
- 鉴于 SMC 具有广泛的表型可塑性,作者接下来研究了 SMC (细胞簇C4–C7)的顺式调节谱。在细胞簇 C4–C7 中,细胞簇 C5 和 C6 主要在分化的 SMC 中具有更大的染色质可及性,而细胞簇 C4 和 C7 主要在调控的 SMC 中具有较大的可及性;
[图片上传失败...(image-16b7a4-1653232206886)]
- 与此同时,chromVAR 显示 AP-1 家族(例如 ATF3)和 TCF21 在纤维肌细胞簇中高度富集,但 TEAD4 在所有的 SMC 细胞簇中都是富集的,说明利用单细胞染色质可及性分析可深入了解 SMC 的调控元件驱动因子;
[图片上传失败...(image-8c46a5-1653232206886)]
- 类似的, 对 " SMC 到纤维肌细胞 " 路径的染色质可及性富集分析,观察到在轨迹最开始时富集了 MEF2 和 CArG motif,随后是 ETS 和 NFY motif,最后在纤维肌细胞中是 AP-1 和 RUNX motif;
[图片上传失败...(image-75f361-1653232206886)]
- 对 SMC 和纤维肌细胞的启动子染色质可及性进行差异分析,在纤维肌细胞鉴定了 170 个显着上调和 108 个显著下调的启动子峰;
[图片上传失败...(image-aca4a2-1653232206886)]
- 上调的纤维肌细胞染色质可及性峰富集了 AP-1(FRA1)、RUNX、TEAD 和 TCF21 motif,以及炎症反应因子 STAT3 和 ARID5A motif;
[图片上传失败...(image-33b831-1653232206886)]
- 上调的纤维肌细胞染色质可及性峰富集的生物学过程主要与细胞外基质组织和细胞迁移过程相关;
[图片上传失败...(image-11eae1-1653232206886)]
- 对 CAD GWAS 基因座的细胞类型进行注释,结果显示 CAD GWAS 基因座主要在 SMC、巨噬细胞、成纤维细胞和内皮细胞富集。排在最前面具有细胞特异性的 CAD 候选位点分别是 rs3918226、rs9337951、rs7500448;
[图片上传失败...(image-84f247-1653232206886)]
- 对四种冠状动脉细胞类型(SMC、巨噬细胞、成纤维细胞和内皮细胞)进行染色质可及性数量性状基因座 (caQTL)分析。在 SMC 细胞中鉴定了最多数量的 caQTL (N=1,984, FDR<=0.05),这与 SMC 细胞数量较多有关。其中 47% 与 GTEx 动脉组织 eQTL 重合;
[图片上传失败...(image-87b0a0-1653232206886)]
- 细胞类型 caQTL 可为 CAD 的致病机制提供一定的支撑。以 CAD 相关位点 rs13324341 为例, rs13324341 为 SMC caQTL 和 MRAS 的 eQTL 位点。说明 rs13324341 可能通过增加 MRAS 染色质可及性以及信使 RNA 表达水平提高 CAD 的致病风险;
[图片上传失败...(image-5ce602-1653232206886)]
- 过去 GWAS 风险位点的靶基因通常被错误地注释为最近的基因,通过 snATAC-seq 分析发现 GWAS 风险位点的靶基因不一定为临近的基因。比如 CAD 有多个风险位点落在 ACTRT2 基因的 5'区域,但 snATAC-seq 的 Peak2Gene 分析显示 CAD 上的风险位点与 PRDM16 表达高度相关,说明 PRDM16 极大可能是 CAD 的靶基因;
[图片上传失败...(image-ecd1ae-1653232206886)]
亮点: snATAC-seq/scRNA-seq + GWAS
文章链接:
https://www.nature.com/articles/s41588-022-01069-0
公开的资料:
- snATAC-seq:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE175621
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE188422 - scRNA-seq:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE131778
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE155513 - 代码:
https://github.com/MillerLab-CPHG/Coronary_snATAC
https://github.com/MillerLab-CPHG/coronary_histology
二、精细解读文献 二
文献题目: Shared genetic architectures of subjective well-being in East Asian and European ancestry populations
不想看英文题目: 东亚和欧洲血统人群主观幸福感的共享遗传结构
杂志和影响因子: Nat Hum Behav (IF: 13.66; Q1)
研究意义: 之前已有很多文献在欧洲祖先群体中探索了主观幸福感(SWB)的遗传因素。然而,SWB 遗传结构是否在人群中共享仍不清楚。为此,作者使用了韩国 ( n = 110,919) 和欧洲 ( n = 563,176) 血统的样本对 SWB 进行了跨人群的全基因组关联分析研究。
结论:
- 首先对三个韩国队列 ( n = 110,919)的样本进行了荟萃分析,鉴定了 3 个新的变异位点;
[图片上传失败...(image-b0e7f8-1653232206886)]
- 与欧洲血统样本 ( n = 563,176) 进行荟萃分析后,总共鉴定了 12 个独立的信号,其中 rs12298541 信号是新发现的。HaploReg 显示 rs12298541 位于活性增强子区域内,且为 TMBIM4 的 eQTL 位点;
[图片上传失败...(image-19a8bc-1653232206886)]
- SWB 在韩国和欧洲队列的遗传度分别为 1.5% (h2=0.015, SE=0.004) 和 3.5% (h2=0.035, SE=0.001);
- 皮尔斯系数和 kappa 一致性检验显示两个血统人群具有中等正相关性(ρ=0.53, P=0.037; κ=0.49, P=0.026);
[图片上传失败...(image-a6985-1653232206886)]
- 对韩国血统 SWB 构建多基因风险评分(PRS), 发现当 P 值为 0.2 时,SNP 对 SWB 的解释度最高。但对韩国血统和欧洲血统的荟萃结果构建 PRS,PRS 的预测结果显著提升。说明整合多个血统的荟萃分析结果有助于提供 PRS 的预测结果;
[图片上传失败...(image-61941a-1653232206886)]
- 对 SWB 进行遗传相关性分析。在欧洲血统中, SWB 与激素、心理、社会经济和消化等表型显着相关。在韩国血统中, SWB 与 吸烟(rg = -0.25,P = 0.02)和 重度抑郁症(rg = -0.34,P = 0.02)显著相关;
[图片上传失败...(image-be02c7-1653232206886)]
- 对 SWB 进行 LDSC-SEG 分析,在欧洲血统中,SNP 显著富集在皮质、边缘系统和海马体中( FDR < 5% )。在韩国血统中,SNP 显著富集在中脑中;
[图片上传失败...(image-137a07-1653232206886)]
- 两样本孟德尔随机化分析(TSMR)显示 SWB 与六个表型(神经质评分、MDD、体脂百分比、体重指数、从不吸烟和看电视的时间)显著相关;
文章链接:
https://pubmed.ncbi.nlm.nih.gov/35589828/
公开的资料:
https://www.ebi.ac.uk/gwas/downloads
三、其他文献推荐
下面的文献也挺精彩的,但由于下不到原文,或博主时间有限,没法精细解读,故列出来供各位参阅;
当然,你们有精彩的文献想让我解读的(前提是一周内刚出炉的文献),可给我发pdf(然而可能种种原因,我不一定有时间解读,不要对我抱太高期待);
文献题目: Feasibility of whole genome and transcriptome profiling in pediatric and young adult cancers
不想看英文题目: 全基因组和转录组分析在儿科和年轻成人癌症中的可行性
杂志和影响因子: Nat Commun (IF: 14.92; Q1)
文章链接:
https://www.nature.com/articles/s41467-022-30233-7
文献题目: Large-scale GWAS of food liking reveals genetic determinants and genetic correlations with distinct neurophysiological traits
不想看英文题目: 食物喜好的大规模 GWAS 揭示了与不同神经生理特征的遗传决定因素和遗传相关性
杂志和影响因子: Nat Commun (IF: 14.92; Q1)
文章链接:
https://www.nature.com/articles/s41467-022-30187-w
文献题目: Genome-wide association meta-analysis identifies 48 risk variants and highlights the role of the stria vascularis in hearing loss
不想看英文题目: 全基因组关联荟萃分析确定了 48 个听力障碍风险变异,并强调了血管纹在听力损失中的作用
杂志和影响因子: Am J Hum Genet (IF: 11.03; Q1)
文章链接:
https://pubmed.ncbi.nlm.nih.gov/35580588/
文献题目: Identifying common transcriptome signatures of cancer by interpreting deep learning models
不想看英文题目: 通过深度学习模型识别癌症的常见转录组特征
杂志和影响因子: Genome Biol (IF: 10.81; Q1)
文章链接:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-022-02681-3
文献题目: Single-cell transcriptome reveals insights into the development and function of the zebrafish ovary
不想看英文题目: 单细胞转录组揭示了斑马鱼卵巢的发育和功能
杂志和影响因子: Elife (IF: 8.14; Q1)
文章链接:
https://elifesciences.org/articles/76014
四、工具或资源类介绍
文献题目: AutoDC: an Automatic Machine Learning Framework for Disease Classification
不想看英文题目: AutoDC:用于疾病分类的自动机器学习框架
杂志和影响因子: Bioinformatics (IF: 5.61; Q1)
文章链接:
文献题目: Artificial intelligence and machine learning approaches using gene expression and variant data for personalized medicine
不想看英文题目: 使用基因表达和变异数据进行个性化医疗的人工智能和机器学习方法
杂志和影响因子: Brief Bioinform (IF: 11.62; Q1)
文章链接:
文献题目: GASS-Metal: identifying metal-binding sites on protein structures using genetic algorithms
不想看英文题目: GASS-Metal:使用遗传算法识别蛋白质结构上的金属结合位点
杂志和影响因子: Brief Bioinform (IF: 11.62; Q1)
文章链接:
文献题目: Evaluation of phenotype-driven gene prioritization methods for Mendelian diseases
不想看英文题目: 孟德尔疾病表型驱动基因优先排序方法的评估
杂志和影响因子: Brief Bioinform (IF: 11.62; Q1)
文章链接:
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbac188/6589867
致谢橙子牛奶糖(陈文燕),请用参考模版:We thank the blogger (orange_milk_sugar, Wenyan Chen) for XXX
感谢小可爱们多年来的陪伴, 我与你们一起成长~