
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于历史匹配和异方差高斯过程建模的政策导向多主体模型优化研究——以COVID-19流行病学模型Covasim为例
【字体: 大 中 小 】 时间:2025年07月18日 来源:Epidemics 3.0
编辑推荐:
本研究针对复杂流行病学ABM(Agent-Based Modeling)模型校准计算成本高的问题,创新性结合历史匹配(History Matching)、异方差高斯过程(hetGP)建模和近似贝叶斯计算(ABC)方法,将Covasim模型的校准效率提升10倍,为政策制定提供更高效的决策支持工具。
在COVID-19大流行期间,流行病学模型成为各国制定防控政策的重要依据。其中基于多主体建模(Agent-Based Modeling, ABM)的Covasim模型因其能模拟个体行为与空间接触网络的优势,被广泛应用于全球十多个国家的疫情预测。然而这类复杂模型面临一个关键瓶颈:由于需要模拟数十万个体的交互过程,单次运行就需30秒,传统校准方法需要超过10万次模拟(约35天计算时间),严重制约了在紧急决策场景下的应用效率。
华盛顿大学(Washington University)的研究团队在《Epidemics》发表的研究中,提出了一种创新性的模型校准框架。该研究以Covasim v2.1.2为对象,针对四个关键参数(每日接触传播率β、工作/社区接触减少率bc_wc1、长期护理机构接触减少率bc_lf、症状检测优势比tn)进行优化。通过四轮历史匹配将参数空间体积缩减99%,再结合异方差高斯过程(heteroskedastic Gaussian process, hetGP)建模和近似贝叶斯计算(Approximate Bayesian Computation, ABC),仅用5,300次模拟就完成了传统方法需要100,000次模拟的校准任务。
关键技术包括:1)采用最大最小拉丁超立方设计(maximin Latin hypercube design)进行参数空间采样;2)建立诊断数和死亡数的时序列hetGP仿真模型;3)基于SCAN(Seattle Coronavirus Assessment Network)和King County公共卫生数据构建验证集;4)应用序列蒙特卡洛ABC(ABC-SMC)进行后验采样。研究特别关注模型输出的"不可约随机性"(aleatoric uncertainty),通过20次重复模拟区分参数效应与随机变异。
研究结果显示:1)历史匹配显著提升拟合度,累计诊断数的均方根误差降低60%,死亡数误差降低30%;2)参数间存在明显拮抗关系,如β与bc_wc1呈负相关;3)ABC后验参数在新随机种子下仍保持稳定,日均诊断误差12.87例(标准差5.19),与原始校准结果(8.58例)相当;4)政策模拟验证显示,测试-追踪-隔离(TTQ)干预能有效控制疫情反弹,与Kerr等原始研究结论一致。
该研究的核心突破在于建立了"快速排除-精细校准"的两阶段框架:历史匹配通过构建非规则输出空间(NROY)快速剔除95%以上无效参数组合;hetGP则利用Woodbury恒等式将计算复杂度从O(N3)降至O(n3),使包含重复模拟的大规模实验成为可能。这不仅解决了ABM模型"校准难"的问题,更开创性地将模型不确定性分解为参数敏感性(通过部分依赖图分析)和固有随机性(通过重复模拟量化)。
在讨论部分,作者比较了"均值导向"与"轨迹优化"两种校准范式的优劣,指出前者更适合政策情景分析,因其不依赖特定随机数序列。研究也承认了三点局限:1)对活跃感染数的拟合精度不足;2)假设输出指标相互独立;3)当前方法可能遗漏多峰后验分布。团队开发的完整分析流程已开源,包括Docker镜像和Zenodo数据归档,为应对未来突发公共卫生事件提供了可扩展的技术储备。
这项工作的深远意义在于,它将计算统计学前沿方法引入公共卫生决策支持系统,使复杂ABM模型真正具备了"实时响应"能力。正如作者强调的,在模型日趋复杂的今天,校准效率本身已成为决定模型实用价值的关键维度。该框架不仅适用于传染病模型,也可推广至气候变化、交通规划等需要快速政策响应的复杂系统建模领域。
生物通微信公众号
知名企业招聘