
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:流行病学模型中近似贝叶斯推断的进展
【字体: 大 中 小 】 时间:2025年09月21日 来源:Epidemics 2.4
编辑推荐:
本综述系统评述了近似贝叶斯推断方法在流行病学建模中的最新进展,聚焦于四大方法族:近似贝叶斯计算(ABC)、贝叶斯合成似然(BSL)、集成嵌套拉普拉斯近似(INLA)和变分推断(VI)。文章深入分析了各方法的理论基础、实现挑战及在传染病动力学、参数推断和实时疫情分析中的应用,为研究者在统计精度与计算可行性之间进行权衡提供了实用框架和选择指南。
贝叶斯推断为传染病建模提供了强大统计框架,因其能够传播不确定性、处理稀疏数据、纳入潜在结构并处理高维参数空间。后验分布根据贝叶斯规则定义:π(θ|y) = π(y|θ)π(θ)/π(y) ∝ π(y|θ)π(θ),其中π(θ)代表观察到数据y前的先验信念,π(y|θ)是观测数据的似然函数。边际似然π(y)作为归一化常数常难以获得闭合形式。实际应用中需满足三个条件:设置适当先验分布、利用后验分布进行不确定性推断以及似然函数需易于处理。然而复杂似然函数常导致后验无闭合解,需依赖数值计算手段。
精确方法如马尔可夫链蒙特卡洛(MCMC)直接从后验分布中采样,但当似然函数难以处理或模型复杂时计算成本高昂。其中Metropolis-Hastings(MH)算法通过构建马尔可夫链探索参数空间,其平稳分布对应于后验分布。但MH算法在现实流行病学场景中常因高参数相关性、多峰后验分布和维度灾难而收敛缓慢。
MH算法通过提议分布生成新参数向量θ′,并以概率α(θ→θ′) = min(1, [π(y|θ′)π(θ′)q(θ|θ′)]/[π(y|θ)π(θ)q(θ′|θ)])接受。虽然广泛应用,但MH依赖随机游走提议,在探索高维后验景观时效率低下,特别是在具有复杂流行动力学的高维空间中。
哈密顿蒙特卡洛(HMC)通过引入辅助动量变量和利用目标分布梯度信息来克服这些低效问题。HMC显著减少随机游走行为,支持高效探索高维或高度相关后验分布。其性能依赖于步长、跳跃步数和动量变量协方差结构等调参参数。现代概率编程工具(如Stan和PyMC)实现了HMC及其自适应变体(如No-U-Turn Sampler, NUTS),自动化参数调优使贝叶斯推断更易被流行病学研究接受。
尽管有这些进步,精确方法包括HMC在应用于复杂高维流行情景时仍计算密集。且严重依赖似然函数的可用性和易处理性。
渐近精确推断方法的实际局限性推动了近似贝叶斯推断方法的发展和兴趣增长。这些方法牺牲部分统计精度以换取计算效率和可扩展性。本部分重点介绍四种主要方法族。
ABC起源于Rubin(1984)和Tavaré等(1997)的接受-拒绝框架。其核心优势在于通用性:通过使用距离度量比较观测数据和模拟数据的摘要统计量绕过显式似然计算。标准拒绝-接受ABC算法包括:从先验分布中采样参数θ?;从模型模拟数据ysim;将观测yobs和模拟数据缩减为摘要统计量s(yobs)和s(ysim);如果距离d(s(yobs), s(ysim))小于预定义阈值ε则接受θ?。该过程提供参数值和摘要统计量的联合分布,通过积分合成数据得到ABC后验近似。
ABC的灵活性使其适用于具有潜在变量、非线性动力学或高维数据的模型。但其性能依赖于三个调参参数:摘要统计量、距离度量和容忍阈值。
多年來ABC经典算法得到显著改进,特别是在三个调参参数上的优化。Harrison和Baker(2020)引入加权欧氏距离方法选择最优权重向量。Bernton等(2019)提出使用Wasserstein距离作为ABC中的距离度量直接比较经验分布。研究人员还将ABC与现有采样器整合以提高可扩展性,包括ABC-MCMC、ABC-SMC和基于粒子的ABC-pMCMC方法。这些方法支持高维参数空间中的高效采样,使ABC类方法应用于流行病学中传播模型参数推断和干预策略评估。
摘要统计量在ABC中通过将高维数据简化为低维表示实现似然无关推断。在传染病建模中这些统计量常旨在捕获关键流行病学特征如流行高峰时间和规模、总感染数或人群间传播动力学。但选择既信息丰富又计算高效的摘要统计量仍是ABC框架中最重大挑战之一。
近期机器学习方法开始改变ABC中摘要统计量的构建和选择方式。这些数据驱动方法旨在直接学习数据与参数间的函数关系,从而最小化对专家设计统计量的依赖。Jiang等(2017)使用深度神经网络拟合摘要统计量与合成数据间关系。Raynal等(2019)引入自动选择信息丰富摘要统计量的方法。?kesson等(2021)引入卷积神经网络架构直接映射高维时间序列数据到参数估计。
合成似然(SL)由Wood(2010)首次提出,为处理难解似然问题提供基于模拟的ABC替代方法。SL不同于ABC的是假设摘要统计量条件于模型参数遵循多元正态分布。SL方法工作流程包括:将观测数据缩减为摘要统计量s;从先验分布采样参数θ;生成N个合成数据集;计算合成摘要统计量;估计未知参数μ?θ = Σsi?/N 和Σ?θ = SST/(N-1);构建对数合成似然ls(θ) = -1/2(s(y)-μ?θ)TΣ?θ-1(s(y)-μ?θ) - 1/2log|Σ?θ|。
该合成似然可直接优化或纳入贝叶斯框架形成贝叶斯合成似然(BSL)后验。每次迭代需要模拟多个合成数据集以估计摘要统计量的经验均值和协方差。大量模拟减少似然方差但增加每次迭代成本。
BSL面临两个主要方法论挑战:减少与合成似然估计相关的计算负担;选择既信息丰富又符合高斯假设的摘要统计量。合成似然估计需要近似摘要统计量的均值和协方差,这些量未知且需为每个候选参数值估计。标准方法中这些量在每次迭代重新估计,导致显著计算开销。
为缓解此问题,提出了几种更高效替代方案。Meeds和Welling(2014)引入减少估计方差的方法,采用高斯过程模型处理每个参数函数。为简化协方差估计,其方法通过仅建模对角线元素近似协方差矩阵。Everitt(2017)提出基于bootstrap的协方差估计器。An等(2019)使用Graphical Lasso产生稀疏、低方差协方差估计。收缩估计器也有助于减少模拟需求。Priddle等(2022)提出使用收缩与白化变换去相关摘要统计量的方法。
但BSL的基本局限性仍然存在:依赖摘要统计量正态分布的假设。当此假设违反时方法的稳健性会受影响。对此近期研究聚焦于放松高斯约束。Fasiolo等(2018)引入扩展鞍点近似作为更灵活的似然近似。Thomas等(2022)提出基于逻辑回归的合成似然方法提高模型适应性。An等(2020)提出半参数密度估计框架结合灵活边际分布与高斯copula。Mu?oz等(2022)考虑聚合计数数据的泊松分布。
BSL在许多理论研究中显示比ABC更能容忍更高维摘要统计量。尽管有理论优势和方法论进步,BSL在流行病学中的应用仍相对有限。Fasiolo等(2014)将BSL应用于生态学和流行病学中的状态空间模型。Woroszy?o等(2018)提供了合成似然首次应用于真实世界观测数据的实例之一。Mu?oz等(2022)将BSL纳入更广泛贝叶斯框架估计复杂大规模流行病学模型参数。
潜在高斯模型(LGMs)是层次模型的广泛类别,其中潜在场遵循多元高斯分布且观测在给定潜在场和超参数条件下独立。此类模型包括许多常用统计模型,如广义线性混合模型、基于高斯马尔可夫随机场的空间和时空模型以及生存模型。
LGMs分层结构包含三个主要组成部分:观测模型、潜在场和超参数。潜在场x|θ2 ~ N(μ(θ2), Q-1(θ2)),其中精度矩阵Q(θ2)是协方差矩阵的逆表示变量间线性关系强度。其通常稀疏反映潜在场中的条件独立性质。超参数θ = (θ1, θ2)控制潜在场和/或似然的行为。
在LGMs中似然π(yi|xi, θ)可通过广义线性/可加(混合)模型视角解释,其中潜在变量xi作为线性预测器ηi。该可加公式允许LGMs包含广泛常用统计模型。
LGMs的关键假设包括少量超参数、高斯潜在场(常建模为高斯马尔可夫随机场)以及给定潜在场和超参数后观测的条件独立性。这些假设支持使用INLA进行高效计算和准确近似。
INLA为近似LGMs中潜在场和超参数的后验边际提供计算高效替代方案。其核心思想使用嵌套拉普拉斯近似近似进行贝叶斯推断所需的高维积分。该方法可概括为三个主要步骤:使用拉普拉斯近似近似超参数后验边际;使用高斯、拉普拉斯或简化拉普拉斯近似近似潜在场条件后验;通过数值积分超参数得到后验边际近似。
INLA的关键特征是利用高斯近似潜在场,通过在模式处评估对数后验曲率获得。曲率通过Hessian矩阵捕获提供模式周围不确定性的量化。
R-INLA包提供用户友好接口使用INLA拟合LGMs,使其更易被流行病学研究人员接受。近期应用实例包括疾病制图和风险估计。例如开发了SSTCDapp等工具使用贝叶斯层次模型估计空间和时空疾病风险。Jin等(2023)开发了新方法估计时变再生数,在低发病率情景下稳健。研究人员还使用INLA比较离散与连续空间模型用于贝叶斯疾病制图,并分析HIV患病率空间分布。
COVID-19大流行期间INLA在实时时空分析中发挥重要作用,如PandemonCAT等工具跟踪大流行进程。其用于评估流动限制影响、估计超额死亡率以及建模SARS-CoV-2再感染动力学。
在传染病监测中INLA应用于纠正报告延迟、改进疟疾干预策略决策以及建模登革热传播动力学。在HIV和慢性病流行病学中INLA改进了HIV风险群体空间异质性估计。此外INLA应用于呼吸和环境健康,绘制呼吸道感染风险图并分析慢性阻塞性肺疾病医院入院空间模式。
自Rue等(2009)引入以来INLA彻底改变了LGMs的贝叶斯推断。多年来INLA经历了显著方法论进步解决与传染病研究相关的关键计算和建模挑战。
传染病建模中最紧迫挑战之一是与高维时空数据相关的计算负担。经典INLA实现因处理时空随机效应维度的计算复杂性而难以处理大量空间单元。为解决此问题Fattah和Rue(2022)提出稠密矩阵公式自动施加时空模型中必要可识别性约束。但需要高性能计算且对于具有数千空间单元的数据集仍计算挑战。为提高可扩展性Orozco-Acosta等(2023)提出分治策略将大空间域划分为较小子区域,使用并行计算同时拟合独立模型,并重新组合结果产生一致后验估计。
经典INLA依赖LGMs的拉普拉斯近似,但当潜在空间变大或需要线性预测器的精确推断时其效率可能下降。van Niekerk和Rue(2024)引入称为变分贝叶斯校正(VBC)的混合近似方法显著提高计算效率。该方法使用低秩校正校正来自拉普拉斯近似的后验均值。其工作还为INLA的现代表述奠定基础其中线性预测器从潜在场中排除。
INLA的早期实现主要适用于具有相对简单结构的潜在高斯模型。近期方法论发展拓宽了其适用于更复杂模型的能力。inlabru包通过允许非线性预测器扩展INLA能力,超越限制性可加线性预测器框架。通过使用一阶泰勒展开的迭代拟合方案实现,允许更复杂函数关系同时保持计算效率。
为扩展到LGM类之外研究人员将INLA嵌入更广泛贝叶斯推断方案中。例如Gómez-Rubio和Rue(2018)使用Metropolis-Hastings MCMC采样条件于其上进行INLA推断的参数,尽管这种方法产生高计算成本。Berild等(2022)提出自适应重要性采样提供更有希望结果且迭代次数更少,但仍限于相对简单模型。
变分推断(VI)是基于优化的近似贝叶斯推断方法,当后验分布解析难解或计算昂贵采样时使用。与MCMC不同,VI将推断转化为优化问题。其往往更快且易于扩展到大数据,适用于需要快速探索许多模型的情景。
VI核心通过选择易处理分布族q(θ;?)近似真实后验分布π(θ|y),并优化其参数?以最小化与后验的差异。该差异通过Kullback-Leibler(KL)散度测量。直接最小化KL散度不可行,因其需要评估难解后验。相反VI通过最大化证据下界(ELBO)作为替代目标函数。
ELBO可解释为平衡两个目标:鼓励近似很好解释观测数据;惩罚与先验的偏差防止过拟合。实践中通过使用随机梯度上升最大化ELBO,梯度通过蒙特卡洛采样估计。该方法允许变分推断高效扩展到大型复杂模型。
该优化框架保证收敛且固有可并行化,可能实现高效推断即使对于大规模模型而不损害模型复杂性。
VI已成为解决现代流行病学分析关键挑战的强大工具,包括实时疾病追踪、爆发预测和大规模基因组监测。
VI已用于从复杂噪声数据流快速推断时变流行病学参数。例如Fan等(2016)使用VI与sigmoid信念网络估计层次图基隐马尔可夫模型中的潜在感染状态。COVID-19期间Chen等(2021)应用Stein变分推断方法高效估计异质COVID-19流行模型中的高维时变参数。Wilder等(2021)提出基于高斯过程的VI方法从稀疏和部分观测检测数据估计时变再生数。在基于个体的建模中Smedemark-Margulies等(2022)应用黑盒变分推断估计网络驱动SEIR模拟中的传播参数。
VI处理高维稀疏数据的能力推进了疾病预测。Senanayake等(2016)应用随机VI扩展高斯过程回归用于建模和预测季节性流感时空传播。McAndrew和Reich(2021)在贝叶斯集成框架内应用VI动态加权模型用于噪声和演化监测数据下的实时流感预测。Tahir等(2023)引入使用VI和流归一化的贝叶斯神经网络预测主要SARS-CoV-2变体的T细胞表位反应。
在基因组流行病学中VI使系统动力学分析达到MCMC方法计算不可行的规模。例如Ki和Terhorst(2022)应用VI从数十万SARS-CoV-2基因组实时估计时间分辨有效再生数。Moretti等(2021)和Fourment等(2023)的方法进一步显示VI在优化系统发育树拓扑和处理系统发育模型中梯度计算中的效用。
VI近年来经历了显著转变。每一代方法论进步解决了特定计算和统计挑战。虽然其中一些进步尚未被传染病建模广泛采用,但它们具有解决现代流行病学研究关键挑战的巨大潜力。
早期VI方法要求研究人员为新模型手动推导优化算法,造成显著采用障碍。Kucukelbir等(2017)引入自动微分变分推断(ADVI)通过自动变换潜在变量空间和计算必要导数将VI重构为通用优化框架。该方法允许建模者以直观术语指定模型同时将计算实现留给自动化系统。该自动化解决了概率建模循环中的计算瓶颈,允许研究人员轻松提出模型、分析大型数据集和迭代修订公式。
但ADVI的随机梯度上升方法常因梯度估计高方差而遭受收敛问题,对于具有强后验相关性或多峰分布的模型尤其成问题。此外基于优化的顺序性质阻止了并行化,限制大规模模型的可扩展性。Zhang等(2022)通过纳入来自拟牛顿优化轨迹的曲率信息而非依赖随机梯度上升来解决这些局限性,并使用逆Hessian基局部高斯近似有效定位后验高概率区域。
许多模型涉及动态演化的潜在过程,如传播率、随机流行轨迹或空间相关发病模式。传统VI因路径依赖和非线性性在此类设置中挣扎。Ryder等(2018)使用基于循环神经网络的变分近似解决此问题,其学会近似随机微分方程模型中的扩散路径。Tan和Nott(2018)开发了结构化精度矩阵方法利用条件独立关系。通过参数化优化为Cholesky因子,其方法允许稀疏精度矩阵反映后验分布中的条件独立结构,显著降低高维模型中的计算复杂性。
流行病学模型通常包含具有良好行为后验分布的全局参数和具有复杂可能非高斯后验的观测特定潜在变量。统一处理所有变量常导致潜在变量近似差。标准VI常崩溃到单峰,产生高方差梯度。认识到这些局限性Loaiza-Maya等(2022)提出混合策略,结合全局参数上的变分推断与局部潜在变量的精确或近似采样。Zimmermann等(2021)开发嵌套VI将嵌套重要性采样集成到变分框架中。该框架学习多个嵌套级别的提议,每个级别优化KL散度以学习中间目标分布。
现代应用日益需要具有数百万参数的模型,如基于个体的模型和基于神经网络的方法,在此类情况下经典VI方法常失效。Chang等(2019)开发集成模型修补技术使贝叶斯神经网络适用于大规模应用。关键创新使用共享参数带有任务特定权重的小“修补”,减少参数开销近乎非贝叶斯训练。
VI的主要关注点是由限制性变分族选择引入的近似偏差,特别是对于重尾或多峰分布。虽然VI原则上允许更灵活非高斯变分族,但此类替代方案在实践中很少使用。大多数实现默认高斯近似出于分析和计算便利,使它们在现实世界应用中受限,尽管底层理论能够支持进一步/多样近似。
我们回顾了四种近似贝叶斯推断方法族的方法论进展及其在流行病学研究中的应用。值得注意的是INLA已被广泛使用,主要由于R-INLA包的可访问性和成熟度。虽然ABC和VI也在流行病学背景中被采用。在许多情况下应用受到先前方法论研究启发或软件工具可用性促进。
MCMC方法提供渐近精确推断,使其成为贝叶斯分析准确性的基准。然而它们带有实际局限性。MCMC依赖于计算模型似然的能力,其计算成本在复杂高维模型中可能变得令人望而却步。ABC通过比较从观测和模拟数据衍生的摘要统计量提供无似然替代方案。虽然ABC灵活且广泛适用,但它严重依赖三个关键调参参数:摘要统计量、距离度量和容忍度。这些依赖关系加上重复模拟的需求可能导致高计算需求。BSL方法通过将摘要统计量分布建模为高斯来解决其中一些问题。这降低了与ABC相比的计算成本。然而该假设可能限制其在表现出强非线性或多峰后验分布的系统中的准确性和适用性。
与ABC和BSL严重依赖模拟和精心选择的摘要统计量不同,INLA使用分析和数值积分组合确定性地近似后验分布。这使其特别适用于具有层次或空间结构的流行病学模型。也就是说INLA的优势带有局限性:其使用最适用于潜在过程可合理建模为高斯的情况。变分推断(VI)通过用参数族近似后验分布提供另一种可扩展替代方案。虽然VI计算高效且适用于高维问题,但它由于依赖特定变分族而引入偏差。灵活变分族可以更好近似复杂后验但常以增加计算负担为代价。相反更简单族提高效率但风险更高近似误差。导航这种权衡常需要接受某种程度偏差以换取速度和可扩展性。这些方法之间固有的权衡,在准确性、可扩展性和稳健性之间,推动了对混合推断框架日益增长的兴趣。
为增强清晰度和为现实世界应用提供实用指导,我们开发了决策图以帮助从贝叶斯推断工具箱中选择最合适工具。该地图围绕一系列关键诊断问题构建,旨在使方法论选择与研究问题的具体特征和需求保持一致。第一步考虑似然函数是否易于处理。如果不是,我们转向无似然方法。在此分支中,如果信息丰富且充分的摘要统计量可用,我们进一步评估它们是否遵循高斯分布。如果是,BSL适用;如果不是,ABC是首选方法。如果似然函数易于处理,我们继续进行基于似然的方法。在这种情况下,如果模型结构与潜在高斯模型一致,INLA非常适合。如果模型不是潜在高斯模型,我们然后考虑可扩展性是否是优先级。当可扩展性关键时,例如在高维或数据丰富的设置中,VI是首选。否则,MCMC仍然是其推断准确性的方法选择。
本文回顾了传染病建模中渐近精确和近似贝叶斯推断方法的最新进展。我们比较了它们的关键特征以更好理解各自优势、局限性和实际应用。为进一步支持现实世界应用,我们开发了决策图旨在指导从贝叶斯推断工具箱中选择适当工具。
精确贝叶斯方法如MCMC提供理论 grounded 推断但常受计算需求、需要易处理似然函数以及高维参数空间或部分观测流行病学数据带来的挑战限制。近似贝叶斯推断方法已成为强大替代方案平衡计算效率与合理推断准确性。ABC、BSL、INLA和VI等方法显著拓宽了快速分析复杂模型的范围,特别是当精确方法计算不可行时。
尽管我们聚焦于近似贝叶斯推断方法,但我们注意到顺序蒙特卡洛(SMC)和粒子MCMC(PMCMC)仍然是流行病学建模中的基础工具。这些方法虽然并不总是计算更快,但对于潜在状态模型和时间序列流行模型中的贝叶斯推断很有用,包括估计时变再生数。它们广泛用于系统动力学和实时爆发分析,其中捕获时间动态至关重要。将它们纳入未来方法论比较或混合方法可以进一步扩展贝叶斯推断在流行病学中的适用性。
尽管如此,近似方法并非没有局限性。近似偏差和缺乏后验准确性的稳健诊断仍然是持续挑战。这些挑战突出两个研究前沿:开发混合贝叶斯推断方法战略整合精确和近似技术的优势,以实现可扩展 yet 理论 grounded 推断;应用这些进步回答重要流行病学问题,满足公共卫生危机期间准确高效推断日益增长的需求。这些领域的进步也将通过机器学习、概率编程和自动化调参策略的发展加速,开辟丰富的跨学科合作机会。
生物通微信公众号
知名企业招聘