《Water Resources Research》:The Effect of Available Data on the Worth of Future Observations for Groundwater Modeling
编辑推荐:
本文系统探讨了地下水模型中现有观测数据(特别是环境示踪剂数据)对后续贝叶斯反演和实验设计(Bayesian experimental design)结果的影响。研究创新性地结合了多水平广义似然不确定性估计方法(MLGLUE)与贝叶斯实验设计框架,通过合成含水层案例证明,包含环境示踪剂观测可显著降低模型预测的不确定性和偏差,提高未来数据采集的有效性。该研究为地下水模型不确定性量化和优化观测网络设计提供了重要方法论支持。
引言
地下水模型是应对当前水资源挑战的重要工具,但模型参数需基于有限的观测数据推断,导致预测存在不确定性。贝叶斯实验设计(Bayesian experimental design)可指导未来补充观测以减少不确定性,但现有研究较少探讨观测数据组成对实验结果的影响。本研究通过结合加速贝叶斯反演与贝叶斯实验设计,分析环境示踪剂观测数据在地下水建模中的作用,重点关注其对预测不确定性和偏差的影响。
方法
逆问题
数值地下水模型可视为从模型参数到模拟观测数据及其他模型输出的映射。贝叶斯逆问题通过求解后验分布来推断模型参数,其核心是似然函数,用于衡量模拟与观测数据的一致性。本研究采用多水平广义似然不确定性估计(MLGLUE)方法加速贝叶斯反演,通过模型分辨率层级结构筛选高似然参数样本,显著降低计算成本。
多水平广义似然不确定性估计
MLGLUE是广义似然不确定性估计(GLUE)的扩展,通过多分辨率模型层级加速计算。低分辨率模型快速筛选参数样本,仅高似本样本进入高分辨率模型,从而减少目标模型运行次数。后验样本用于后续实验设计,无需额外模型评估。
实验设计
实验设计旨在通过选择补充观测来最大化预期信息增益,减少感兴趣量(QoI)的不确定性。本研究使用互信息(mutual information)作为效用函数,基于Kullback-Leibler散度衡量补充观测对QoI分布的影响。通过顺序设计流程,逐步选择能最大程度降低不确定性的观测点。
测试问题
研究使用合成含水层案例,模拟稳态地下水流和瞬态溶质运移。模型参数包括水力传导系数和补给率,通过高斯过程回归生成空间异质场。观测数据包括水力头和氚浓度,考虑两种数据可用性场景:包含示踪剂数据(W/)和仅含水力头数据(W/O)。通过贝叶斯反演和后续实验设计,分析不同场景下QoI的不确定性变化。
结果
贝叶斯反演
MLGLUE显著降低了计算负担,W/场景和W/O场景的后验样本数分别为2,584和3,415。包含示踪剂数据降低了浓度和年龄相关QoI的不确定性和偏差,但增加了水力头的偏差。年龄相关QoI的初始分布范围在W/O场景下更大。
实验设计
补充观测的效用空间分布因观测类型而异。水力头观测的效用分布较扩散,而浓度观测的效用更集中。W/场景下,效用的相对差异较小,且对效用的高估较少。顺序设计显示,前5-10个补充观测带来最大信息增益,年龄相关QoI的效用最高。
讨论
结果解读
环境示踪剂数据有助于更好地约束QoI的分布,缓解仅凭水力头数据反演参数的非唯一性问题。实验设计结果受初始观测数据集影响,W/场景下不确定性和偏差的降低更显著。补充观测的选择反映局部与区域信息的平衡,早期设计偏好局部观测。
实验设计的可靠性
通过贝叶斯反演降低初始不确定性可提高实验设计的可靠性。然而,实验设计结果受方法选择(如先验分布、似然函数)影响,需在实用性与计算效率间权衡。
可转移性
虽然基于合成案例,但研究方法可转移至实际问题。MLGLUE等高效方法使贝叶斯实验设计在真实场景中更具可行性。
总结与结论
MLGLUE与贝叶斯实验设计的结合具有实用价值。包含环境示踪剂数据可降低预测不确定性和偏差,提高实验设计效果。浓度观测对年龄相关QoI尤为重要。未来工作可考虑概念模型不确定性、多目标优化等因素。