使用长期水文数据,对比数值模拟、神经网络模拟和混合建模方法来模拟爱尔兰西北部喀斯特流域的泉水流动情况

《Journal of Hydrology: Regional Studies》:A comparison between numerical, neural network, and hybrid modelling approaches to simulate spring flow from a karst catchment in northwest Ireland using long-term hydrological data

【字体: 时间:2025年08月21日 来源:Journal of Hydrology: Regional Studies 4.7

编辑推荐:

  本研究以爱尔兰马诺尔汉密尔顿喀斯特泉为对象,对比了物理数值模型与深度学习模型(LSTM、GRU、NARX)及其混合模型的性能。结果表明,结合数值模型的LSTM-SC混合模型在准确性和稳定性上表现最优,优于单一模型,验证了物理机制与数据驱动方法结合的有效性。研究发现,LSTM在捕捉长期依赖关系方面优于其他模型,而混合模型通过结构化组合显著提升了极端事件预测能力。

  ### 解读:基于深度学习与物理模型的混合方法在喀斯特泉流量模拟中的应用

本研究聚焦于利用五年的水文数据对爱尔兰曼罗汉姆林地区喀斯特泉的流量进行模拟,并对比了十种不同的建模方法,包括一个基于物理的数值管道网络模型以及三种神经网络模型(LSTM、GRU 和 NARX)和六种混合的数值-神经网络模型。研究发现,所有神经网络模型在再现喀斯特泉流量时间序列方面均优于数值模型,但混合模型,尤其是 LSTM+PN+SC 模型,展现出更高的准确性、稳定性和在不同流量条件下的泛化能力。这一发现表明,将物理系统理解与深度学习相结合,对于模拟复杂的喀斯特系统具有显著的优势。研究还探讨了在类似爱尔兰喀斯特地貌中应用多种神经网络模型和混合技术的优缺点,为地下水管理与预测提供了重要的参考。

#### 喀斯特地下水系统的复杂性与建模挑战

喀斯特地下水系统是一种由碳酸盐岩石构成的复杂地质结构,内部存在地下洞穴和导水通道,以及裂缝等能够传导水流的结构。与非喀斯特含水层相比,喀斯特含水层的特点在于水流通过这些导水通道迅速从地表的汇水区流入含水层,再通过泉眼流出。这种特殊的结构导致喀斯特系统在水文响应上表现出高度的非线性和异质性。由于喀斯特系统的复杂性,传统建模方法如数值模型和概念模型在模拟其水流行为时面临诸多挑战,包括参数不确定性、结构概念化困难以及难以准确捕捉非线性关系。

#### 数值模型与神经网络模型的对比

数值模型通常基于流体力学原理,通过求解流量方程来模拟地下水流动。在本研究中,使用的是 InfoWorks ICM 2025.1 软件构建的管道网络模型,该模型通过质量与能量守恒原理来模拟水流路径。尽管数值模型能够提供较为系统的水文信息,如水文平衡和水文图,但它们在模拟内部水流动态方面存在局限。此外,数值模型在喀斯特系统中往往难以校准,因为其结构和概念化存在不确定性。

相比之下,神经网络模型,特别是长短期记忆网络(LSTM)、门控循环单元(GRU)和非线性自回归外生输入网络(NARX),在模拟复杂的非线性水文系统方面表现出色。这些模型能够通过学习历史数据中的模式,对未来的水文条件进行预测。研究发现,LSTM 和 GRU 在捕捉长期依赖关系和避免梯度消失问题方面具有显著优势,使得它们在模拟喀斯特泉流量时表现更为稳健。而 NARX 虽然在处理动态系统方面有其独特之处,但在高非线性系统中对噪声的敏感性较高,因此其性能相对较低。

#### 混合模型的构建与应用

为了提高模拟的准确性,本研究采用了两种混合建模策略:残差误差校正(REC)和顺序组合(SC)。REC 方法通过计算数值模型输出与实际观测之间的残差,将这些残差作为神经网络的输入,从而在模型输出中进行修正。SC 方法则是将数值模型的输出作为输入的一部分,结合神经网络进行预测。这两种方法分别在不同的模型中进行了测试,以评估它们在喀斯特泉流量模拟中的有效性。

研究结果表明,混合模型在模拟精度、稳定性以及泛化能力方面优于单独的数值模型和神经网络模型。特别是 LSTM+PN+SC 模型,它在训练和测试阶段都表现出色,能够有效捕捉极端流量事件并保持稳定的模拟结果。这说明,将物理模型的结构信息与神经网络的非线性学习能力相结合,可以克服单一模型在复杂水文系统中的局限,提高模拟的可靠性。

#### 模型训练与验证过程

在模型训练过程中,研究采用了多种数据分割策略,以确保模型的稳定性和泛化能力。数据被分为训练集、验证集和测试集,各占不同的比例。通过随机分割和交叉验证,研究者确保了模型在不同数据子集上的表现具有代表性。此外,数据预处理和标准化也是提高模型性能的重要步骤,通过将变量进行归一化处理,可以增强模型的收敛性和预测能力。

在模型训练中,研究者使用了 Adam 优化器对 LSTM 和 GRU 进行训练,而对于 NARX 模型则采用了梯度下降法并结合动量常数和自适应学习率。这些训练策略有助于模型在训练数据中找到最佳的参数组合,同时避免过拟合问题。在模型验证阶段,研究者使用了多种性能指标,如均方根误差(RMSE)、决定系数(R2)、纳什-sutcliffe 效率系数(NSE)和 Kling-Gupta 效率(KGE)来评估模型的准确性、偏差和可靠性。

#### 模型性能分析

通过对比不同模型的性能指标,研究发现神经网络模型在训练阶段表现优异,但在测试阶段,它们的泛化能力相对有限。例如,LSTM 在训练阶段的 KGE 达到了 0.855,但在测试阶段下降至 0.597,显示出一定的过拟合现象。相比之下,GRU 在训练阶段的 KGE 为 0.788,测试阶段为 0.649,表明其在非线性系统中的表现较为稳健。NARX 模型在训练阶段的 KGE 为 0.764,但在测试阶段显著下降,显示出其在处理动态水文系统时的局限性。

混合模型在测试阶段表现出更高的泛化能力和更稳定的模拟结果。LSTM+PN+SC 模型在测试阶段的 KGE 达到了 0.727,而 GRU+PN+REC 模型在测试阶段的 KGE 为 0.674。这些结果表明,混合模型在结合物理模型的结构信息和神经网络的非线性学习能力方面具有显著优势,能够更准确地模拟喀斯特泉的流量变化。

#### 模型不确定性分析

为了评估模型的不确定性,研究者采用了 95% 置信区间(CI)和残差分析。CI 分析显示,LSTM 和 GRU 模型在模拟流量时与观测数据的匹配度较高,尤其是在峰值流量事件中。相比之下,NARX 模型在模拟低流量和高流量时表现出较大的不确定性。残差分析进一步揭示了模型在不同流量条件下的偏差情况,表明混合模型在减少残差偏差和提高模拟精度方面具有更好的表现。

#### 研究意义与未来展望

本研究不仅为喀斯特泉流量模拟提供了新的方法,还为未来在类似喀斯特地貌中应用混合建模策略提供了重要的参考。研究结果表明,将物理模型与神经网络相结合,能够有效提高模拟的准确性、稳定性和泛化能力。这为在数据有限、地质结构复杂的环境中进行地下水模拟提供了新的思路。未来的研究可以进一步探索更复杂的混合模型结构,如结合概率或基于流态的方法,以更好地管理模型的不确定性。此外,引入更多的环境预测因子,如土壤含水量、蒸散发和植被指数,可以增强模型对地下水流动态的敏感性。最后,为了提高模型的泛化能力,跨不同喀斯特系统的验证工作也是必要的。

#### 结论

本研究首次在爱尔兰应用了数值-神经网络混合模型,并通过两种不同的混合策略(REC 和 SC)对喀斯特泉流量进行了模拟。结果表明,混合模型在模拟精度、稳定性以及泛化能力方面优于单一模型,尤其是在处理极端流量事件和非线性水文响应时。LSTM+PN+SC 模型在所有测试阶段均表现出色,显示出其在喀斯特系统中的适用性。研究还指出了当前模型在模拟低流量和基础流量时的不足,并建议未来的研究应关注模型的泛化能力和跨系统验证。通过结合物理模型和深度学习方法,可以为喀斯特地下水模拟提供更全面的解决方案,推动该领域的进一步发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号