编辑推荐:
在寨卡病毒(Zika virus)研究中,存在监测偏差问题。研究人员开展 “Estimating transmissibility of Zika virus in Colombia in the presence of surveillance bias” 主题研究,校正偏差后发现女性更易感等结果,对理解病毒传播、防控疾病意义重大。
寨卡病毒是一种令人闻风丧胆的新兴传染病,自 1947 年在乌干达的寨卡森林被首次发现后,一直潜伏在暗处,伺机而动。2015 - 2016 年,它如同幽灵般迅速席卷美洲,包括众多加勒比国家。美洲地区温暖的气候、充沛的降水,再加上人口密集,简直成了传播寨卡病毒的主要病媒埃及伊蚊(Aedes aegypti mosquitoes)的 “天堂” ,适宜的生态环境让病毒得以大肆传播,截至 2017 年 12 月,这场疫情波及了 48 个国家和地区。
在哥伦比亚,2015 年 5 月巴西寨卡疫情爆发后,该国便开始了初步监测,同年 8 月启动了官方监测。然而,随着人们逐渐认识到寨卡病毒与小头畸形(microcephaly)和格林 - 巴利综合征(Guillain - Barré syndrome)等严重后果之间的关联,监测工作出现了偏差。由于重点关注孕妇和育龄妇女(15 - 39 岁女性),导致这部分人群在监测数据中的占比过高,使得研究寨卡病毒传播动力学变得困难重重。以往研究虽尝试解决监测偏差问题,但大多模型假设各人群报告概率一致,与实际情况不符。因此,迫切需要一种更精准的研究方法,来校正监测偏差,准确揭示寨卡病毒的传播特性,为疾病防控提供可靠依据。
为了攻克这一难题,来自香港大学李嘉诚医学院公共卫生学院世界卫生组织传染病流行病学和控制合作中心、美国佛罗里达大学、香港理工大学等机构的研究人员携手开展了深入研究。他们利用哥伦比亚 2015 年 7 月 27 日至 2016 年 11 月 21 日的全国监测数据,构建了贝叶斯分层模型框架(Bayesian hierarchical modeling framework) ,旨在重建症状性病例的真实数量,并在考虑不同年龄 - 性别组报告差异的情况下估计传播参数。
研究人员首先收集了哥伦比亚国家公共卫生监测系统中所有疑似和实验室确诊的寨卡病例信息,这些病例主要依据临床症状进行初步识别,随后部分通过逆转录聚合酶链式反应(RT - PCR)进行确认,但实验室确诊率仅约 4%。同时,他们还收集了人口密度、温度、降水等多种与寨卡病毒传播相关的社会环境因素数据。
接着,研究人员构建了一个三层分层模型。第一层为报告子模型,将每个年龄 - 性别组每周的病例数视为潜在变量,代表校正报告差异后的 “真实” 病例数,通过二项分布将其与观察到的病例数联系起来,以此定义报告概率,并假设监测能力在 2015 年 7 月 14 日至 11 月 30 日逐步提升。第二层是 Poisson 传播模型,用于估计寨卡病毒的传播动力学,该模型考虑了年龄组、性别、温度、降水、登革热累计发病率、森林覆盖率、人口密度和海拔等多个协变量。最后,利用贝叶斯数据增强框架(Bayesian data augmentation framework)和 Metropolis - Hastings 算法估计未观察到的 “真实” 病例数和模型参数。
在研究结果部分:
- 寨卡疫情情况:2015 - 2016 年哥伦比亚共报告 103,875 例症状性病例,排除部分数据后,102,592 例纳入分析,其中实验室确诊 8048 例(7.8%) 。育龄妇女病例数在 2015 年 12 月左右显著增加,其报告发病率高于其他年龄 - 性别组。
- 累积发病率和报告概率:研究发现,育龄妇女症状性病例的检测率达 99%(95% CI:98.7 - 100),而其他人群为 85.4%(95% CI:84.7 - 86.1)。校正后,育龄妇女真实发病率为 4.92(95% CI:4.91 - 4.94)/1000 人,比观察值高 13.4%;其他年龄 - 性别组真实发病率为 1.57 - 2.77/1000 人,比观察值高 24.4% - 36.2%。
- 传播动力学:校正报告概率后,不同地区发病率存在显著差异。加勒比、安第斯和亚马逊地区发病率为 2.14 - 2.59/1000 人,太平洋和奥里诺科地区分别高达 3.71(95% CI:3.69 - 3.73)/1000 人和 6.64(95% CI:6.59 - 6.71)/1000 人 。0 - 14 岁儿童和 40 岁及以上成年人比 15 - 39 岁成年人的易感性分别低 52.7%(95% CI:51.9 - 53.6%)和 38.4%(95% CI:37.4 - 39.3%) ,女性比男性易感性高 82.8%(95% CI:80.2 - 85.2%) 。温度每升高 1°C,症状性感染易感性增加 13.0%(优势比(OR):1.130;95% CI:1.125 - 1.135);降水每增加 1 cm/hr,易感性降低 9.4%(OR:0.906;95% CI:0.896 - 0.916) 。登革热发病率高的地区,寨卡病毒感染风险也高;森林覆盖率低的地区,寨卡病毒传播几率大幅增加;人口密度和海拔与寨卡病毒传播风险呈非线性关系。
- 模型评估:通过将模型预测的报告病例数与观察数据对比,以及模拟研究验证模型恢复未知参数的能力,结果表明模型拟合良好,参数估计偏差小。
- 对比分析和敏感性分析:忽略报告偏差的模型与主模型相比,部分预测因子效应大小存在差异,进一步证实校正报告偏差的重要性。同时,敏感性分析显示,不同初始报告概率假设和报告能力变化时间假设下,研究结果稳健。
研究结论表明,该研究提出的贝叶斯分层模型框架,有效校正了因寨卡病毒与先天性寨卡综合征临床关联导致的监测偏差。研究发现女性对寨卡症状性感染更易感,这不仅与报告率有关,还可能存在生物学因素。多种环境和地理因素对寨卡病毒传播有显著影响。此外,模型校正后的发病率比报告值高 10 - 20%。不过,研究也存在局限性,如分析仅在部门层面,缺乏病媒直接丰度数据,可能存在未测量的混杂因素。
总体而言,这项发表在《Nature Communications》上的研究意义重大。它为校正类似监测偏差提供了可借鉴的统计方法,该方法可推广到其他存在类似监测偏差的传染病研究中。研究结果有助于公共卫生部门更准确地评估寨卡病毒传播风险,制定更有效的防控策略,同时也呼吁及时收集血清学调查等相关数据,以进一步校正监测偏差,更好地应对新兴传染病挑战。