中国人是否对新冠病毒更易感? 包含几大数据库揭示
转载大师 • 2020年2月19日 pm3:12 • 研究进展 • 阅读 350
中国人是否对新冠病毒更易感?
作者:陈瑛、单科家
太长不看版:目前并没有证据支持东亚人对新冠病毒更易感这一观点
具体解读
截止2020年2月19日7点中国的新型冠状病毒肺炎(COVID-19)确诊患者累计已经超过7万4千例,但影响新冠病毒(SARS-CoV-2)易感性的人口学因素仍不清楚。由于非典和新冠肺炎都爆发于中国,部分学者提出了东亚人更容易感染这两种冠状病毒的观点。SARS-CoV和SARS-CoV-2刺突蛋白与细胞膜蛋白ACE2有较强的结合能力,后者是这两个病毒进入细胞的唯一已知受体。中国科学院遗传与发育生物学研究所钱文峰课题组的博士后陈瑛与博士生单科家通过比较不同年龄、性别和种族人群中ACE2的表达水平和遗传多态性,尝试寻找SARS-CoV和SARS-CoV-2的潜在易感人群。相关文章于2月18日放置于学术预印本网站preprints.org上,题目为“Asians and Other Races Express Similar Levels of and Share the Same Genetic Polymorphisms of the SARS-CoV-2 Cell-Entry Receptor”。
阅读原文:https://www.preprints.org/manuscript/202002.0258/v1
如何寻找ACE2差异表达的人口学影响因素?
作为生物大数据分析背景的研究者,我们首先产生了两个思路:
第一个思路是利用The Genotype-Tissue Expression Project(GTEx,基因型-组织表达研究计划)建立的数据库直接寻找答案。GTEx数据库收录了上百个人类个体多种组织的转录组数据(样品提供者生前已同意将这些样品在死后用于相关的科学研究)。我们可以通过该数据直接判断ACE2是否在亚洲人的肺部表达更高。然而,尽管GTEx项目收集了500多个肺转录组,但是其中来自亚洲人的样品极少(~1%,见下图),不适合回答我们的科学问题。
(来自https://gtexportal.org/home/tissueSummaryPage)
我们的第二个思路是联用GTEx项目和The 1000 Genomes Project(1KGP,千人基因组计划)的数据开展研究。GTEx项目通过全基因组关联分析已经找到了大量决定某个基因在特定组织表达水平的位点 (eQTL,简而言之,可以根据该位点的DNA序列判断某个基因在特定组织的表达水平);而1KGP则收集了来自于26个分布于全球的各个种族人群的2504个个体的基因型数据(见下图)。
(来自https://www.internationalgenome.org/home)
通过联用GTEx和1KGP,我们可以首先查看GTEx中鉴定到的ACE2在肺部表达的eQTL,然后分析这些eQTL在1KGP中不同人群间的分布状态,进而推测ACE2在不同人群肺部的表达水平。然而,尽管GTEx鉴定出了一系列ACE2的eQTL(见下图),绝大多数都在神经系统,没有一个是决定该基因在肺部表达水平的。
(来自https://gtexportal.org/home/gene/ACE2#eQTLBlock)
既然以上两种思路都行不通,我们开始考虑使用The cancer genome atlas(TCGA, 癌症基因组图谱项目)中的数据作为替代方案。
如何使用癌症基因组学数据鉴定ACE2差异表达的人口学影响因素?
TCGA中收录了594例的肺腺癌患者以及551例的肺鳞癌患者的肺部样品。前期研究显示肺腺癌可能与SARS-CoV与SARS-CoV-2侵染的肺细胞类型关系更为密切,而且ACE2也确实在肺腺癌样品中表达水平更高,因此我们接下来的研究也集中于肺腺癌样本。这些肺腺癌患者有着不同的年龄、性别和种族,潜在可以用于研究ACE2在肺部表达水平的人口学相关因素。
然而特别值得注意的是,如果ACE2表达本身受到癌症发生的影响,则TCGA数据显然不可以用来研究健康人群ACE2的表达。为此我们比较了这些患者的肿瘤组织和正常肺组织(癌旁组织)中ACE2基因的表达水平,发现二者并无显著差别(下图A)。另外,ACE2的表达水平既不影响肺腺癌患者的生存概率(下图B),也不随癌症的发展而显著变化(下图C)。这些结果说明已有的海量癌症转录组数据可以用来研究影响ACE2表达水平的人口学因素。
ACE2在癌症发生过程中的表达水平不变
我们发现,ACE2的肺部表达水平和年龄存在正相关,年龄越大ACE2的肺部表达水平越高(下图A),这一发现可能可以部分解释老年人更易感新冠肺炎的观察。男性和女性ACE2的肺部表达水平并无差异(下图B),该结果与中国疾控中心发布的截止于2020年2月11日的超7万病例的流行病学特征一致(确诊病例男女比例武汉为0.99:1,全国为1.06:1)。
在TCGA的肺腺癌数据中,只有7例为亚洲人。为了扩大亚洲人肺腺癌的样本量,我们进一步整合了翟巍巍课题组在新加坡收录的来自于181个华裔肺腺癌患者的260份转录组数据。分析发现亚洲人ACE2的肺部表达水平并没有显著高于其他人种(下图C)。
年龄(A)、性别(B)和种族(C)对ACE2表达水平的影响
是否可能东亚人其他组织的ACE2表达水平的高于非洲人和欧洲人?
ACE2基因编码血管紧张素转化酶2,本身在肾素-血管紧张素系统中发挥功能,只是被SARS-CoV和SARS-CoV-2借用来侵染细胞。ACE2在肺部只是中等程度表达,而更高表达于肾脏、消化道以及睾丸(下图,病毒感染后的症状上更多表现为肺炎可能是因为病毒可以更轻易通过飞沫传播接触到肺细胞)。
(来自https://gtexportal.org/home/gene/ACE2#geneExpression)
已有报道这些ACE2高表达的组织在重症患者中也会被SARS-CoV或者SARS-CoV-2感染。那是否可能东亚人由于在其他组织的ACE2表达水平的高于非洲人(黑人)和欧洲人(白人)而更易感呢?我们筛选了TCGA中所有ACE2表达高于肺腺癌的癌症类型,发现不仅是肺部,在其他ACE2高表达的组织中,ACE2的表达水平在不同人种之间都没有显著差别(下图,从左到右分别对应头颈、胃、胰腺、结肠、直肠、以及两种肾组织)。当然这还是比较初步的结果,未来需要进一步增加亚洲人的样本量进行比较。
其他ACE2高表达的组织中,ACE2的表达水平在不同人种间都没有显著差异
是否可能东亚人中存在影响ACE2蛋白序列、翻译、折叠或者亚细胞定位的独特突变因而易感呢?
为了研究是否存在可以影响蛋白功能的东亚人特有遗传多态性,我们检测了人类群体中ACE2转录本区域的遗传多态性。我们从1KGP中获取了ACE2转录本区域的712个遗传多态性位点(其分布下图)。
ACE2转录本区域的遗传多态性分布
我们计算了每个位点在东亚人群(包括北京汉族、南方汉族、西双版纳傣族、东京日本人、胡志明市越南人这五个类群)和全世界人群的等位基因频率。影响氨基酸序列的22个多态性位点在所有人群中频率都很低(下图红点,重合到了一起),因此不存在东亚人特异的ACE2蛋白序列。剩下的690个遗传多态性绝大多数位于内含子,不影响氨基酸序列。即使考虑它们,亚洲人与全球人群的等位基因频率差异也不大(下图),因为大多数点分布在对角线周围。
亚洲人与其他人种的ACE2的DNA多态性频率
即使是差异最大的多态性位点之一(如上图绿圈所示),且不说其是否有生物学功能,在东亚人群中的分布也远谈不上独特性(如下图所示)。
rs141554379在26个分布于全球的人群中的频率
(Ref:参考基因组[-];Alt:单碱基插入[A],根据1KGP数据绘制)
结论
不论是ACE2在包括肺在内的多个组织中的表达水平还是ACE2的遗传多态性数据都不支持亚洲人更易感新冠病毒的观点。冠状病毒及其宿主动物蝙蝠的高度多样性(以及饮食文化)或许是对中国近二十年来两次冠状病毒爆发更好的解释。我们警示任何使用种族来预测个体对新冠病毒易感性的行为,全球各国都需要同等水平的防护来抵御新冠病毒。
当然,我们的研究还存在一定的局限。首先,我们目前的研究集中在转录水平,ACE2蛋白水平在不同人种中是否存在差异以及这些ACE2蛋白是否都位于细胞膜上都还需要进一步研究。其次,ACE2可能只表达于部分肺细胞(例如2型肺泡细胞),而我们分析的是混合样品的转录组(尽管我们认为无论增加表达ACE2的细胞数目还是增加ACE2的单细胞表达水平都会导致易感性的上升并且可以通过混合样品的转录组检测到)。第三,非典或新冠病毒是否存在其他受体也需要进一步的研究。另外,尽管非典或新冠病毒的侵染效率与ACE2有关,决定病毒细胞内繁殖效率的因素依然未知,有待未来进一步探索。
Reference
Chen, Y.; Shan, K.; Qian, W. Asians and Other Races Express Similar Levels of and Share the Same Genetic Polymorphisms of the SARS-CoV-2 Cell-Entry Receptor. Preprints 2020, 2020020258 (doi: 10.20944/preprints202002.0258.v1).
阅读原文可以链接到文章:https://www.preprints.org/manuscript/202002.0258/v1