《Frontiers in Marine Science》:Deep probabilistic surrogate modelling for uncertainty quantification in mangrove hydro-morphodynamics
编辑推荐:
本文提出了一种基于深度高斯过程(Deep GP)的概率代理建模框架,用于解决红树林生态系统水动力-形态动力学模型中的不确定性量化(UQ)难题。该研究通过分层堆叠多个高斯过程层,有效捕捉了系统内复杂的非高斯行为和高维相互作用,相较于传统高斯过程(GP)模型,在计算效率上提升了三个数量级(1.4分钟对比5天),同时预测误差降低了五倍(RMSE: 0.0095米对比0.0465米)。此方法为基于自然的沿海韧性(NbS)规划和气候变化适应策略提供了高效、可靠的决策支持工具。
引言:红树林生态系统作为基于自然的解决方案的重要性与建模挑战
红树林生态系统在提升海岸带应对海平面上升和气候极端事件的韧性方面,正日益被视为至关重要的基于自然的解决方案(NbS)。然而,由于物理过程的复杂性以及求解纳维-斯托克斯(Navier-Stokes)偏微分方程的高计算成本,实现对红树林系统水动力-形态动力学模型的稳健不确定性量化(UQ)仍然是一个关键挑战。传统的不确定性量化方法,包括高斯过程(GP)代理模型和物理信息神经网络(PINNs),因其无法充分捕捉非高斯行为、高维相互作用,或难以有效扩展到大规模海岸系统而受到限制。
高斯过程基础代理模型在红树林水动力-形态动力学中的应用
水动力-形态动力学系统描述了不同时空尺度上流体流动、泥沙输运和形态演化之间的相互作用。这些过程由质量和动量守恒定律控制,在塑造包括河口和海岸线在内的沿海地貌方面发挥着关键作用。红树林生态系统是水动力-形态动力学反馈的一个动态例证,其根系网络能衰减流速、促进泥沙沉积并稳定岸线。准确模拟这些过程需要整合水动力、泥沙输运和生态表征,通常需要使用复杂的数值模型。
水动力-形态动力学建模的核心方程是深度平均的浅水方程(SWEs)。该方程组包括代表质量守恒的连续方程和代表动量守恒的方程。此外,形态演化(包括泥沙输运)由深度平均泥沙浓度的平流-扩散方程控制。
鉴于数值模拟的计算成本高昂,本研究旨在开发一个代理模型,近似输入(如时间、边界条件)与输出(如水面高程)之间的映射关系。遵循贝叶斯建模方法,我们在未知函数上放置了一个高斯过程(GP)先验。在GP先验下,训练输入处的有限函数评估集合服从联合多元正态分布。常用的核函数是指数二次型(RBF)核。通过给定训练数据,可以推导出新测试输入的预测后验分布,该分布也是高斯的,具有明确的预测均值和协方差表达式。
利用深度高斯过程增强水动力-形态动力学建模
标准的GP模型为复杂系统提供了有效的代理模型,但在处理高维输出和非线性关系时面临可扩展性挑战,因为其计算成本相对于数据点数量呈立方级增长。为了克服这些限制,我们采用了深度高斯过程(Deep GP)模型,该模型通过分层组合多个GP层来更灵活地模拟复杂的高维映射。
深度GP通过递归嵌套GP映射来定义。这种分层组合允许每一层连续捕获前一层未解释的剩余非线性和隐藏相关性,类似于深度神经网络中的特征提取,但保留了不确定性的完全贝叶斯处理。
为了有效训练深度GP模型处理高维水动力-形态动力学数据,需要在保留关键非线性依赖关系和相关不确定性的同时减少输出空间的维度。我们采用了贝叶斯高斯过程潜变量模型(Bayesian GPLVM)作为一种概率化的、可扩展的降维框架。贝叶斯GPLVM通过完全概率映射捕获数据内的非线性结构,同时提供不确定性量化。为了高效管理复杂数据集,采用了基于诱导变量的稀疏近似,以降低计算需求。
深度GP模型的训练涉及递归地应用GP映射和基于GPLVM的降维。主要训练步骤包括:初始化、递归推断、逐层组合、优化和最终模型构建。核超参数和噪声方差使用自动相关性确定(ARD)核进行初始化,并通过基于梯度的优化器(Adam)最大化证据下界(ELBO)进行优化。
一旦模型训练完成,深度GP模型通过递归地将不确定性传播通过潜在层来预测新测试输入的输出。主要的预测步骤包括:第一层预测、递归传播和最终输出预测。这种不确定性感知预测使我们能够估计在新的强迫条件下的未来水位、泥沙分布或形态变化,同时量化相关的置信区间。
基于深度高斯过程的不确定性量化方法
本研究将经典的UQ框架扩展到深度GP设置,提出了一种基于抽样的方法,通过训练好的深度GP模型高效地传播不确定性并估计感兴趣的统计量。具体方法是,从每个潜在层的变分后验分布中生成蒙特卡洛(MC)实现,然后递归地通过深度GP结构传播这些实现,以估计感兴趣的量(QoIs),例如模型输出y的均值和方差。
需要强调的是,该框架中使用的蒙特卡洛积分与传统基于MC的UQ方法有根本区别。传统方法中每个MC样本都需要对底层数值模型进行完整评估,这在复杂的形态动力学模拟中计算上是不可行的。而本框架利用的是训练好的深度GP代理模型的预测分布中的样本。这允许以可忽略的成本快速生成实现,同时仍然捕获代理中编码的模型形式(认知)和预测不确定性。
类似地,蒙特卡洛样本可用于近似Y的方差、可信区间或其他汇总统计量。这种概率UQ框架特别适用于水动力-形态动力学建模,其中输入(如潮汐强迫、泥沙特性或植被密度)的不确定性通过复杂的非线性过程传播,影响输出(如水面高程、流速和形态演化)。
水动力-形态动力学模型的不确定性量化案例研究
本研究将提出的深度GP框架应用于孙德尔本斯(Sundarbans)水动力-形态动力学区域。该区域是世界上最大的连续红树林,由于海平面加速上升、热带气旋和人为压力而面临严重威胁。研究域覆盖了孟加拉湾大陆架,包括孙德尔本斯红树林森林,采用空间变化的网格分辨率。
模型输入为时间,输出为每个时间步长空间域的高程。使用留一法交叉验证(LOOCV)来评估模型的样本外性能。对于准确性评估,使用了均方根误差(RMSE)和均方根对数误差(RMSLE)。
使用具有两个隐藏层的深度GP来近似输入和输出之间的复杂映射。应用自动相关性确定(ARD)来丢弃每个潜在空间维度中权重非常小的维度。训练从使用贝叶斯GPLVM降低模型输出的维度开始。在应用BGPLVM后,优化的ARD权重表明,大多数输出维度被有效降低到接近零,只有一个主导维度承载了大部分方差。
在降低输出维度后,深度GP模型将输入拟合到降维后的输出。最终,通过最终的GP层从潜在预测构建预测输出。深度GP模型的平均RMSE和RMSLE值分别为0.0095和0.0052,这表明该模型在准确模拟数值模型方面具有强大能力。
时空性能可视化显示,深度GP模型在重建来自潜在空间的完整维度输出空间方面具有显著准确性。使用第4节中介绍的UQ算法,估计了深度GP模型的预测均值的均值和预测方差的均值及其相应的近似误差。结果表明,深度GP模型在捕获和传播整个域的不确定性方面是有效的。空间上,不确定性在河道分叉和海岸-植被界面附近最高,在较深或形态动力学稳定的区域最低。时间上,在水位快速变化期间不确定性增加,在系统接近更稳定的水动力条件时不确定性减少。
深度GP与标准GP性能的比较评估
将深度GP模型的性能与标准GP进行比较。标准GP使用RBF核和相同的训练/测试程序。GP模型的平均RMSE和RMSLE分别为0.0465和0.0466。这表明,与深度GP相比,后者比标准GP模型精确5倍。误差比较显示,深度GP在早期时间步长也表现更好,显示了其在不依赖大量前期数据的情况下模拟输出的能力。
关于UQ分析,使用深度GP方法计算了预测均值的后验均值、预测方差的后验均值及其相应的近似误差。两种模型的性能相似,但深度GP在方差均值方面略有改善。深度GP在选定空间位置的预测密度函数(PDF)显示出比标准GP更低的变异性,证实了深度GP具有更低的预测方差和更强的鲁棒性。
关于运行时间,深度GP模型总共需要1分钟43秒,这比数值模型快了3个数量级。标准GP模型仅需16秒,虽然更快,但深度GP的准确性远高于GP,其适度的额外计算努力是值得的。
深度GP框架的优势源于其分层结构,使其能够比标准GP或浅层代理模型更有效地表示多尺度非线性和非高斯依赖性。与深度神经网络或PINN相比,深度GP保留了完全的贝叶斯公式,自然地通过模型传播不确定性,提供校准的预测区间,同时避免过度自信外推的风险。与物理信息神经网络(PINNs)、贝叶斯物理信息神经网络(BPINNs)和多项式混沌展开(PCE)等其他先进代理方法相比,深度GP在准确性、鲁棒性和计算成本之间展示了更有利的权衡。
结论与未来工作展望
主要发现与研究意义
本研究提出了一种使用深度GP在复杂水动力-形态动力学模型中有效实施UQ的新方法。该框架通过提供更高的预测准确性和显著降低的计算成本,展示了相对于传统代理模型的实质性改进。它成功捕获了时空海岸过程中固有的复杂非线性相互作用,并产生了稳健的UQ输出。深度GP在模拟大空间域的高维输出时,始终优于标准GP模型。贝叶斯GPLVM的集成实现了自动降维,从而带来了更好的计算可扩展性和泛化能力。
研究局限性
尽管提出的深度GP方法高效且准确,但仍存在一些局限性。当初始或边界条件发生重大变化时,代理模型需要重新训练,这可能涉及额外的计算和设置时间。此外,深度GP依赖于变分推断,因为精确的贝叶斯解在分析上是难以处理的,这引入了可能的近似误差。另一个关键问题是深度GP缺乏固有的物理可解释性;在没有嵌入物理约束的情况下,模型可能会产生统计上合理但物理上不可信的预测。
未来研究方向建议
未来的研究应侧重于加强所提出的深度GP框架的鲁棒性和泛化能力。首先,应针对罕见或极端条件进行定向采样,并结合训练集的自适应丰富,以确保在快速水动力转变或气候引起的极端情况下的可靠性能。其次,一个充满前景的方向是将深度GP与物理信息建模相结合。将守恒定律直接嵌入核设计或变分目标中可以提高物理保真度。最后,在线或迁移学习技术的集成代表了动态演化的海岸系统应用的一个重要机遇。这些方法将支持实时预测和气候适应性海岸管理中的操作决策。