翻译原文:[https://science.sciencemag.org/content/early/2020/03/13/science.abb3221?rss=1]
摘要 评估未记录的新型冠状病毒(SARS-CoV2)患者的感染率和传染性对了解该疾病的总体发病率和大流行潜力至关重要。在这里,我们使用中国境内已报道的感染观测数据,并结合人口流动数据、网络化的动态人口模型和贝叶斯推断方法,来推测SARS-CoV2相关的关键流行病学特征,包括未记录的感染者的感染率及其传染性。我们估计,在2020年1月23日武汉封城前,未确诊患者占所有感染者的比例高达86%(95%的置信区间:82%-90%)。未确诊患者的人均传染率是已确诊患者(置信区间为44%-69%)的55%,而由于这部分患者的数量更多,他们成为已确诊病例的79%的传染源。这些研究结果解释了SARS-CoV2为何能在地理空间上快速地传播,也表明了控制这种病毒的传播特别具有挑战性。
2019年底,出现在中国武汉的新型冠状病毒(SARS CoV2)迅速传播到中国的其他所有省份,同时,截止到2020年3月1号,疫情也蔓延到其他58个国家。虽然人们正在努力遏制这种病毒的传播,但是鉴于病原体的传播性和毒性还有许多不确定性,这些努力的有效性还尚未清楚。
未记录但具有传染性的病例比例是一个重要的流行病学特征,能够调控急性呼吸道病毒大流行潜力。这些未被证实的感染者通常会出现轻症、有限或无感染症状,因此无法被识别出。并且由于这部分患者的具有传染性和数量较多,使得他们感染的人口比例要比其他情况下受病毒感染的比例高的多。本来是不会出现这么多的感染比例的。在这里,为了充分评估SARS-CoV2的流行病潜力,我们使用模型推断框架来估算在武汉出入境关闭的前后几周内,中国的未确诊患者的传染性和感染比例。
我们开发了一个数学模型来模拟中国375个城市感染的时空动态(见补充材料)。在模型中,我们将感染者分为两类:(1)有严重症状的足以被证实的被确诊患者,即能观察到的感染病例;(2)没有被确诊出的感染患者。这两类感染者具有各自的传播率:β表示已确诊的患者的传播率,μβ即β减去一个因子μ,表示未记录感染者的传播率。
SARS-CoV2在城市之间的空间传播是由从j城市到i城市的旅客日流量和一个乘数因子来表示的。具体来说,春节期间(“春运”)期间,中国375个城市之间的每日旅客人数是根据腾讯定位服务收集到的2018年春运时期(2018年2月1日至3月12日)人员流动数据得出的。春运为期40天,即农历新年之前的15天和之后的25天。在此期间,中国境内的出行率很高。为了估算从1月10日起算的2020年春运时期的人员流动数据,我们将2018年的腾讯春运数据与这次春节的相应时间进行了匹配。例如,我们使用2018年2月1日的旅客流动数据来表示2020年1月10日的流动数据,因为这两个时间点距离农历新年的间隔时间一样。在2018年春运期间,腾讯数据共采集了17.3亿个旅行事件,然而,据报道全国旅客发送量达29.7亿人次。为了补偿漏报和协调这两个数字,我们在模型中引入了一个大于1的旅行乘数因子(请参阅辅助材料)。
为了推测SARS-CoV2在疫情爆发早期阶段的传播动态,我们采用迭代滤波—集合调整卡尔曼滤波(IF-EAKF)框架模拟了2020年1月10日-23日(即武汉封城之前,图S1)的观测数据。将该模型和推测模型系统相结合,我们估算出375个城市中每个城市的四个模型状态变量的轨迹。(四个参数分别表示城市i的亚人群的易感性,暴露性,确诊感染和未确诊但感染),同时估计出六个模型的参数值(Z,D,μ,β,α,θ:分别表示平均潜伏期,平均感染时常,未证实的感染者的传播减少因子,确诊感染者的传播率;确诊感染者的比例和旅行乘数因子)。
有关模型初始化的详细信息,包括暴露的和未记录的感染者的初始种子,请参见补充材料。为了解决感染确诊的延迟问题,我们还使用伽马分布定义了实时事件观察模型(请参阅补充资料)。 具体地对各组的每个新病例,从均值为Td的伽马分布中生成一个报告延迟天数td(以天为单位)。 在拟合模型合成的爆发人数和观察到的爆发人数时,我们使用模型推测系统来进行模拟,拟合时采用不同的Td固定值(6天≤Td≤10天)和不同的最大种子值即Seed max(1500≤Seedmax≤2500)(请参阅补充材料,图S2)。通过对数似然法来确定最佳拟合后验估计模型。
我们首先将模型推断框架与其他模型形式进行了对比测试,并使用了模型在自由模拟过程中生成的疫情合成数据。 这些测试验证了模型推断框架能够准确地同时估算六个目标模型参数(请参见补充方法和图S3至S14)。这个推测系统的确可以识别各种参数组合,并区分α值从高到低、μ值从低到高的疫情变化情况。参数的可识别性是通过在模型推测系统中引入将375个城市的观察病例数据以及在数学模型结构中加入人口迁移数据来实现的(请参见补充方法,图S15和S16)。
接下来,我们将模型推断框架应用于1月23日出行限制之前观察到的疫情数据,截止2020年2月8日的报道,全国共有801例记录在案的病例。图1中的A到C展示了使用最佳拟合模型参数估计生成的报道病例的模拟结果。这些随机模拟的分布很好地反映了观测病例的范围。
此外,最佳拟合模型还捕捉到新型冠状病毒(COVID-19)传播到中国其他城市的感染情况(图S17)。我们对有效传染数(Re)的中位数估计为2.38(95%置信区间:2.04-2.77),该值与疫情流行初期的基本传染数(R0)相当,这表明COVID-19具有较高的持续传播能力。这一发现与最近其他几份研究中的传染数估计一致。此外,潜伏期和感染期的中位数估计值分别约为3.69天和3.48天。 我们的研究还发现,在1月10日至1月23日期间,中国报告的确诊病例数只有总感染病例的14%(95%置信区间:10-18%)。这一估计显示了一个非常高的未记录感染者比例:86%。从武汉撤离的外国人的感染率也独立地证实了这一发现(请参阅补充材料)。这些未记录感染者的人均传染力估计是确诊患者的一半(μ= 0.55;95%置信区间:0.46-0.62)。其他的模型拟合使用了Td和Seedmax的替代值或不同的假定分布也得到了相似的参数估计值(图S18至S22),这与使用某种可替代模型结构所作的估计结果一样,这个模型采用的数据是未记录和已记录病例的平均感染时间(请参阅补充方法,表S1)。进一步地,考虑到模型的结构和可用的观察病例的数量之多,灵敏度测试表明α和μ是唯一可识别的(参见补充方法和图1,E和F)。特别地,图1F示出了最大对数似然法的拟合值处于α和μ的95%的置信区间内,并随着远离最佳拟合模型(α= 0.14,μ= 0.55)而逐渐下降。
我们使用最佳拟合模型(表1和图1)估计,在1月10日至1月23日期间,武汉市新增COVID-19病例共计13118例(95% CI: 2974-23435),包括所有确诊和未记录感染者。此外,这些感染病例中的86.2%(95%置信区间:81.5%-89.8%)是由未记录感染者的病毒传播感染的。在1月10日至1月23日期间,全国共有16,829 (95% CI: 3,797–30,271)名患者,其中86.2% (95% CI: 81.6%–89.8%)的患者是由未记录感染者感染的。
为进一步研究有传染性的但未记录的 COVID-19感染者对整体传播和总报告病例数的影响,我们使用最佳拟合参数估计(但μ=0,即未记录感染者不再具有传染性,见图2)生成了一组假定疫情数据。
我们发现,如果没有未记录感染者的传播,中国在1月10日至1月23日期间报告的感染病例可减少78.8%,武汉则可减少66.1%。此外,在这期间累计确诊病例超过10例的城市较少,只有1个城市在1月23日确诊病例超过10例(图2)。这一发现表明,具有传染性的、未记录的感染者助长了新冠病毒在中国地理空间上的传播。
我们还模拟了1月23日之后新型冠状病毒在中国的传播情况。当时采取了更大的控制措施, 这些措施包括主干城市和武汉之间的出行限制、政府倡导的自我隔离和接触注意事项以及更多可用于确诊感染的快速检测试技术的研发(11, 12)。上述这些措施以及由于对病毒认识的增强和个人保护行为的增加(例如佩戴口罩、增加社交距离、患病时自我隔离),导致民众就医行为发生变化,这可能改变了1月23日之后疫情的流行病学特征。为了量化这些差异,我们使用模型推断框架和1月24日至2月8日期间的城市每日报告病例,重新估算了系统参数。1月23日之后,由于城市间的流动性受到限制,他们测试了两种不同的出行情景:情景1:根据百度流动性指数的变化(表S2),进出武汉的旅行减少了98%,其他所有城市之间的出行减少了80%;情景2:完全停止城际旅行(即θ为0)(有关更多详细信息,请参见补充方法)。
表2,图S23至S26和表S3展示了1月24日至2月8日的推断结果。由于控制措施在不断调整,我们对1月24日至2月3日(阶段1)、1月24日至2月8日(阶段2)这两个时间段均进行了估计。为情景1建立的最佳拟合模型在这两个时间段内都表现出报告延迟时间Td缩短,即仅延迟6天(1月23日之前的报告延迟时间为10天),这一结果和后期病例的更快确诊也符合。
潜伏期和感染期的估计与1月10日至1月23日的估计相似,但是α、β和Re都发生了很大变化。确诊病例的传播率β在阶段1降至0.52(95%置信区间:0.39-0.71),在阶段2降至0.35(95%置信区间:0.27-0.50),不到出行限制前的β估计值的一半(表2)。所有确诊感染比例中,α的估计值为0.65(95%置信区间:0.60—-0.69),即在阶段1,65%的感染病例被确诊,比出行限制之前的α更高(限制前仅确诊了14%的感染病例);在阶段2,这一比例几乎保持不变。同时,阶段1的传染数为1.36(95%可信区间:1.14-1.63),阶段2的传染数为0.99(95%可信区间:0.76-1.33),均低于出行限制前2.38的传染数。然而,相对传播率μ的估计值低于1月23日之前的估计值,未记录感染者的传染力μβ也大幅降低,可能反映出,这期间只有症状非常轻微、传染性也较低的这部分病例还未得到确诊,或者是个人防护行为和预防措施被证明有效。在场景2(完全不出行)下得到了相似的参数估计值(表S3)。由于这两个时期的就医行为和管控措施在不断变化,我们应该慎重解释阶段1和阶段2的预测结果。
总的来说,我们的研究结果表明,在1月23日中国实施出行限制和其他高度管控措施之前,有很大比例的新型冠状病毒感染者没有被确诊,也有很大比例的感染是由这些未确诊的感染者作为传播媒介带来的(表1)。大量未确诊的感染者中大部分人可能症状并不严重,这似乎助长了新冠病毒在国内的迅速传播。确实,在模型模拟时,抑制这些未确诊病例的传染性可以减少确诊病例的总数和SARS-CoV2 的总体传播率(图2)。另外,最佳拟合模型显示从发现感染到最终确诊有一个9天的延迟时间。 相反,1月10日至23日同时期的列表数据表明从症状初显到确认的平均延迟为6.6天。这种差异表明确诊患者可能有较为典型的症前迹象。 病毒血症发作的起点、峰值与新冠肺炎病症发作的起点、峰值的的相对时间关系可能会影响疫情管控措施的功效。
我们的研究还表明,要完全控制SARS-CoV2,就需要从根本上增加对目前未记录的感染者的诊断和隔离。新闻报道的增加和普通人群对该病毒的认识可能已经促使呼吸道症状患者寻求医疗护理的比例增加。此外,医护人员和公共卫生官员的的意识以及病毒鉴定分析手段的可用性表明,识别未发现感染者的能力已经提高。同时,普通民众和政府已经提出了一些应对措施,比如增加了口罩的使用量、限制出行、推迟开学和隔离疑似患者等。这些措施都可能进一步减缓新冠病毒的传播。
综合起来,这些措施有望提高报告率,减少未确诊感染的比例,并减少感染的增长率和传播率。确实,1月23日之后的中国疫情流行病学特征的估计结果表明,政府的管控努力和民众意识的提高已经降低了新冠病毒病毒的传播率(即β、μβ、Re均减小)、增加了确诊病例的报告率,以及减轻了早已超负荷的医疗系统的负担。
重要的是,中国的实际情况每天都在变化。不同城市正在对新人群采取新的出行限制和管控措施,而且这些迅速变化的影响使得对疫情的流行病学特征的某些估计变得困难。此外,报道的不准确性和不断变化的就医行为也给我们的预测增加另一种程度的不确定性。虽然此处提供的数据和研究结果表明出行限制和控制措施能够大幅减少SARS-CoV2的传播,然而这些管控措施是否足以将Re降至1以下,即完全消除当地病情和预防疾病反弹所需的时间,一旦放松管控疫情是否会反弹还尚未清楚。此外,中国境外必须实施类似的控制措施和出行限制才能阻止病毒的重新引入。
2020年1月10日至23日的估计结果描述了在还未出台主要限制或管控措施的情况下,SARS-CoV2在中国发达社会中的传播特点。这些研究发现为未记录感染者的比例及其在这种环境下的相对传染性提供了基础评估。然而,管控措施、病毒的监测和检测、病例定义和报告方面的差异可能会影响感染者的记录率。因此,这项研究的关键发现是,86%的感染者是未被记录的,而这些未记录的感染者的人均传染力是确诊患者的55% 。当然在管控、监测和报告实践等方面不同的其他国家,这种情况可能会发生变化。
我们的研究结果强调了SARS-CoV2的严重性和大流行的潜力。2009年H1N1大流行性流感病毒也产生了许多轻微病例,并在全球迅速传播,最终发展成地方性疾病。目前,已有四种地方性的冠状病毒株(即229E、HKU1、NL63、OC43)在人群中流行。如果这种新型冠状病毒沿袭2009年的H1N1大流行性流感的模式,它也将在全球范围内传播,并成为在人群中流行的第五种冠状病毒。
参考文献 略 图表见原文