
-
生物通官微
陪你抓住生命科技
跳动的脉搏
新发传染病与入侵物种防控策略优化:基于部分可观测马尔可夫决策过程的资源分配模型
《Proceedings of the National Academy of Sciences》:Strategic planning of prevention and surveillance for emerging diseases and invasive species
【字体: 大 中 小 】 时间:2025年09月22日 来源:Proceedings of the National Academy of Sciences 9.4
编辑推荐:
本文针对新发传染病与入侵物种防控中的资源分配难题,提出了基于部分可观测马尔可夫决策过程(POMDP)的优化模型。该模型通过平衡预防与监测(surveillance)投入,实现了跨地域、跨时空的资源最优配置,显著降低了首次检测前的累计病例数(平均减少22%)并提前了8个月以上的检测时间,为公共卫生和生态系统健康管理提供了科学决策工具。
引言背景
新发传染病(Emerging infectious diseases)和生物入侵(Biological invasions)对全球公共卫生和生态系统健康构成日益严重的威胁。气候变化、土地利用变化以及人类与野生动物接触增加等因素加剧了这类风险。传统的管理方式多为被动响应,即在病原体或入侵物种被发现后才分配资源,但此时疫情可能已广泛传播。因此,采取预防(Prevention)和监测(Surveillance)等主动措施至关重要,以最大限度减少首次检测前的扩散。
模型构建与方法
研究团队开发了一个部分可观测马尔可夫决策过程(POMDP)模型,用于优化多个地理位点(Sites)的预防和监测资源分配。该模型考虑了不完全检测(Imperfect detection)、系统动力学、风险空间异质性(Spatial heterogeneity)以及成本差异,并可扩展至大尺度景观。每个位点的疾病状态被建模为马尔可夫链,状态包括无病(Disease-free)或感染(Infected),感染状态进一步按流行率(Prevalence)分级。预防措施可降低疾病引入和传播风险,而监测措施则通过抽样检测来早期发现疫情。检测概率取决于流行率和监测努力(Surveillance effort),且存在假阴性可能。
目标函数是最小化首次检测前所有位点的预期累计病例数,即最小化疾病增长曲线下的面积(Area under the disease growth curve)。模型将POMDP重新表述为确定性最优控制问题,利用信念(Belief)——基于所有可用信息的真实状态后验概率——在连续阴性检测结果下的确定性演化,实现了计算的可扩展性。
主要结果
均衡策略(The Equilibrium)
研究发现,最优策略在大部分规划期内维持预防和监测努力于一个稳定均衡(Turnpike equilibrium)。仅在初始阶段需要动态调整以引导系统趋向均衡。均衡源于疾病扩散效应(Disease-spread effect)和阴性检测效应(Negative-test effect)的平衡:前者降低无病概率,后者通过连续阴性检测增加无病信念。当先验信念(Prior belief)与均衡信念一致时,稳定努力即为最优;否则需进行调整。收敛时间取决于先验信念与均衡信念的差异及预算水平。
预防与监测的平衡(Balancing Prevention and Surveillance)
通过单一位点显式公式分析发现,监测始终必要,而预防仅当其有效性足够高或预算充足时才应使用。低预算下应聚焦监测;高预算下需结合预防。当引入率(Introduction rate)低时,预防更受青睐,因监测成本高而效果低。
监测努力的集中与分配(To Concentrate or Distribute Surveillance Effort)
最优监测策略取决于多个因素:
空间异质性:引入率均匀时分配努力,差异大时集中努力。
均衡阶段:趋向均衡过程中采用分阶段扩展策略(Phased-expansion strategy),先从单一或少数位点开始,无检测时逐步扩展范围。
预算:小预算倾向于集中策略,大预算倾向于分配策略。
成本结构:线性或凸成本函数下分阶段扩展最优;凹成本函数(存在规模经济)下轮换策略(Rotational strategy)可能最优,即努力在多个位点间交替集中。
案例研究:纽约州慢性消耗性疾病(CWD in Cervids in New York State)
以纽约州野生白尾鹿(Odocoileus virginianus)的慢性消耗性疾病(CWD)管理为例,CWD是一种致命性朊病毒疾病,在北美和北欧蔓延,但尚未在纽约州野生鹿群中检测到。研究基于年引入率估计和县级检测成本数据,优化了62个县的年度预算分配(例如50万美元)。
现有监测策略基于引入风险和鹿群密度,但未明确考虑成本差异。预防措施包括执行鹿只和尸体流动法规、公众教育以及通过扑杀(Culling)降低种群密度以将基本繁殖数(R0)控制在1以下。
最优策略显示:
初始阶段(2025年)预防努力集中在高监测成本县,监测努力集中在少数县。
2026年起,预防和监测资源分布扩展至更多县(分阶段扩展策略)。
若无检测,约2年后达到均衡,此后监测优先于边境县(引入风险高),预防优先于内陆县。
模拟表明,与当前实践相比,最优策略将首次检测前累计病例平均减少22%(从0.132降至0.103),检测时间平均提前8.4个月。等效性能下,最优策略年成本可降低24%(至38万美元)。
预算规划(Budget planning)
模型可用于估计实现特定绩效目标所需的最小预算。例如,纽约州环境保护部(NYSDEC)需至少每年32万美元以实现平均4年内检测新引入,超过100万美元/年以将平均检测时间缩短至2年。
讨论与展望
该模型为不完全信息下的疾病和入侵物种管理提供了原则性资源分配方法,整合了行动(预防)和信息(监测)的成本与价值。长期稳定策略简化了物流,但动态再分配在检测发生于过渡阶段时仍重要。
模型局限性包括:引入率和预防有效性估计的不确定性,可通过稳健优化(Robust optimization)或贝叶斯自适应POMDP(Bayes-adaptive POMDP)处理;监测样本可能存在偏差;决策过程在检测后终止,未明确纳入检测位点奖励;未来可整合模拟模型(如基于代理模型)以捕获更多细节。
该框架可扩展至人畜共患病监测(Zoonotic disease surveillance)等低资源环境,提升全球卫生安全。
生物通微信公众号