
-
生物通官微
陪你抓住生命科技
跳动的脉搏
英格兰2023/24年麻疹暴发期间实时病例预测与趋势分析模型的开发与应用
【字体: 大 中 小 】 时间:2025年08月08日 来源:Journal of Infection 11.9
编辑推荐:
针对英格兰麻疹暴发期间实验室确诊数据滞后影响实时监测的问题,UKHSA团队开发了基于广义加性模型(GAM)的实时预测模型,通过整合症状出现日期、报告延迟和地域因素,将全国病例预测误差降低42%,趋势判断准确率提升69%,为突发传染病精准防控提供了创新技术支撑。
2023年初,英格兰遭遇了十年来最严重的麻疹疫情暴发。这场由疫苗接种率下降引发的公共卫生危机,暴露出传统监测系统的致命缺陷——由于从症状出现到实验室确诊平均存在8天延迟(最长可达47天),决策者拿到的数据总是"慢半拍"。当西米德兰兹郡的疫情已开始下降时,实时数据却仍显示上升趋势,这种"数据时差"严重影响了防控措施的精准实施。
面对这一挑战,英国卫生安全局(UK Health Security Agency, UKHSA)的首席数据官团队迅速行动起来。Maria L Tang领衔的研究小组开发了一套创新的实时预测(nowcasting)系统,通过分析2734例实验室确诊患者的症状出现日期、最早报告日期(本地实验室检测接收日期与参考实验室报告日期中的较早者)等关键数据,构建了基于广义加性模型(Generalized Additive Model, GAM)的预测框架。该模型创新性地将病例数分解为Nt,d(症状出现第t天、延迟d天后报告的病例数),并针对不同检测类型(本地实验室检测中位延迟6天 vs 参考实验室23天)和地区(伦敦病例延迟显著长于西米德兰兹郡)设置了差异化的延迟参数。
研究团队采用三大关键技术:1)使用负二项分布处理过度离散的计数数据;2)通过薄板回归样条(thin plate regression splines)捕捉时间和延迟的非线性效应;3)基于1000次后验抽样生成预测区间。模型每周更新训练数据(105天回溯期),预测未来4周病例数,并创新性地将趋势划分为"上升/稳定/下降"三类(阈值±0.1)。为验证效果,团队还设置了仅用已知数据的基线模型和基于报告日期的对照模型。
研究结果显示:在病例预测方面,实时预测模型表现突出。全国层面,其对数加权区间评分(log WIS)较基线模型降低42%,90%预测区间覆盖率显著提高。特别是在伦敦的多峰疫情中,模型准确捕捉到2月的数据回填现象——当原始数据显示病例下降时,模型预测实际存在35%的未报告病例。
趋势判断方面更具突破性。通过比较连续4周病例总和的差异,实时预测模型对全国趋势的判断准确率比基线提高69%。有趣的是,基于报告日期的模型在追踪西米德兰兹郡单峰疫情时表现尚可,但在伦敦复杂疫情中出现2周的判断滞后,这印证了症状出现日期对趋势预测的关键价值。
在讨论部分,作者指出该研究有三重意义:首先,这是首个针对麻疹暴发的实时预测系统,填补了该领域技术空白;其次,证实了分区域、分检测类型建模的必要性——伦敦参考实验室检测占比达28%(西米德兰兹郡仅17%),导致其整体延迟更长;最后,创建的标准化趋势分类体系(基于RPS评分)为非技术决策者提供了直观判断工具。
该成果发表于《Journal of Infection》后,已直接指导英国调整疫苗接种策略。正如研究者强调的,这项工作的真正价值在于揭示:在突发传染病应对中,数据时效性有时比数据精度更重要——当完美成为及时的敌人时,基于不完整数据的科学预测可能就是最优解。未来研究可探索将实验室处理能力等外部变量纳入模型,以进一步提升在疫情快速变化期的预测灵敏度。
生物通微信公众号
知名企业招聘