利用不完整数据模拟径流：水文学方法、深度学习方法及混合方法的比较

《Journal of Hydrology》：Modeling runoff with incomplete data: a comparison of hydrological, deep learning, and hybrid approaches

【字体：大中小】 时间：2026年02月16日 来源：Journal of Hydrology 6.3

编辑推荐：

　　该研究系统评估了XAJ（物理过程）、LSTM（数据驱动）及META、Guided-LSTM（混合模型）三种类型 runoff 模型在不同数据稀缺条件下的性能表现。通过人为构建40个流域的多样化数据缺失场景，发现XAJ模型在低数据可用性（0.1-0.3）下仍保持高可靠性（NSE/KGE均超0.7），而混合模型通过物理过程约束与数据驱动优势的互补，在不同数据稀疏水平（0.1-1.0）展现出适应性更强的预测能力。研究揭示了模型架构与数据完整性之间的关键关联，为数据受限环境下的模型选型提供了量化依据。

中国海南省海口市海南大学生态学院生态环境修复工程中心，邮编570228

摘要

水文数据的可用性在不同地区和时间段内差异很大，这往往会影响校准和验证径流模型以有效管理水资源的能力。对于在数据稀缺条件下的模型性能和敏感性，目前仍了解有限。为此，本研究系统地评估了三类径流模型在不同程度和类型的数据稀缺情况下的表现：基于物理过程的 Xinanjiang (XAJ) 模型、数据驱动的 Long Short-Term Memory (LSTM) 模型，以及两种混合模型——META 和 Guided-LSTM。通过在不同地区的四十个流域人为引入数据缺失，我们模拟了三种典型的数据缺失情景和十个级别的数据稀疏度。结果表明，深度学习模型对数据可用性非常敏感，并且数据集中流量模式和极端值的覆盖情况也受到影响。相比之下，基于物理过程的 XAJ 模型在数据稀缺条件下仍然可靠，其平均 NSE 和 KGE 值均超过 0.7。这两种混合模型在不同数据条件下都展示了结合物理过程知识与数据驱动灵活性的优势。这些发现强调了在实际水文应用中根据数据可用性选择模型的重要性。

引言

多年来，气候变化和人类活动背后的复杂机制在区域和全球范围内深刻影响了水文过程（Yang 等，2021），促使水文学家和政策制定者重新考虑如何在变化的环境中有效评估水文过程以减轻灾害风险。作为水文循环的关键组成部分，准确的径流预测长期以来一直是研究的重点（Wu 等，2023）。面对这些不断变化的挑战，减少径流预测的不确定性已成为当务之急。

径流建模方法大致可以分为三类：基于物理过程的模型、数据驱动的模型和混合模型。基于物理过程的模型，如 Xinanjiang (XAJ)（Ren-Jun，1992）和 Variable Infiltration Capacity (VIC)（Liang 等，1994）模型，使用预定义的结构和参数来模拟流域的物理行为（Pandi 等，2021）。由于它们的物理可解释性和公认的可靠性，这些模型得到了广泛应用（Mohammadi 等，2024；Yang 等，2025；Zhao 等，2024），但其性能通常依赖于特定地点，并且需要专家进行参数化，这限制了它们在具有不同水文特征的流域中的适用性（ávila 等，2022；Herrera 等，2022）。

相比之下，数据驱动模型如 ARIMA、支持向量机（SVM）（Raghavendra 和 Deka，2014）和 Long Short-Term Memory (LSTM) 网络（Kratzert 等，2018）依赖于统计或机器学习算法来学习输入变量和目标输出之间的直接关系，而不需要明确建模潜在的物理过程。在过去十年中，这些模型在水文学中的应用迅速增加，支持降雨预测（Aswin 等，2018）、洪水预测（Sankaranarayanan 等，2020）、土壤湿度估计（Li 等，2021）和径流模拟。这得益于它们捕捉高度非线性关系的强大能力（Shao 等，2024）。然而，它们的可靠性依赖于丰富的高质量数据，而且其“黑箱”性质可能会降低物理可解释性（Sheng 等，2023；Xu 等，2024）。

作为两种方法单独使用时局限性的替代方案，混合模型应运而生（Zarei 等，2025b；Zarei 等，2024）。它们通常遵循两种主要的整合范式：（1）特征级指导，即将来自基于物理过程或概念模型的输出作为学习算法的额外输入。这种方法已被广泛用于指导神经网络，使用基于物理过程的模型模拟的流量或蒸散量等水文变量（Liu 等，2024）；（2）架构级整合，将物理原理更内在地融入模型结构中（Wang 等，2024），使网络能够学习基于物理过程模型的行为模式，如 META 框架（Cai 等，2024）。虽然混合模型提供了一种平衡且适应性强的建模方法，但可能会引入额外的不确定性来源。理解和系统评估这些不确定性仍然是该领域的一个未解挑战（Sezen 和 Sraj，2024）。

在所有这些方法中，观测到的径流数据对于模型校准和训练至关重要（Jaffar 等，2024）。量化这些数据引入的不确定性对于确保模型预测的可靠性至关重要（Douville，2024）。Prediction in Ungauged Basins (PUB) 研究计划在水文估计方面发挥了关键作用（Arsenault 等，2023；Hrachowitz 等，2013），强调了将水文知识从有测量数据的流域转移到无测量数据的流域的重要性（Sivapalan 等，2003）。然而，随着观测技术和监测基础设施的最新进展，完全无测量数据的流域（超过一定规模）越来越少（Andreadis 等，2025；Mazi 等，2023），部分观测数据和数据稀疏的流域变得更加普遍。

许多研究表明，模型性能对校准数据的特性非常敏感（Hou 等，2023；Mai 等，2022）。大多数研究都认识到校准期长度的重要性（Fathi 等，2025；Lees 等，2021；Moosavi 等，2022）。这一观点基于这样的前提：更长的数据集涵盖了更广泛的流量条件，特别是对于具有众多参数的复杂模型或研究气候变异性的研究（Arsenault 等，2018）。相反，其他研究认为数据质量可能比数据长度更具影响力（Pool 和 Seibert，2021；Seibert 等，2024），表明即使是一年的高质量观测数据也可能足以进行可靠的校准（Sorooshian 等，1983）。尽管有这些见解，但相对较少的研究探讨了径流时间序列完整性对模型校准和训练的影响（Shen 等，2022）。Zhang 和 Post（Zhang 和 Post，2018）使用两种概念模型（GR4J 和 SIMHYD）研究了澳大利亚 780 个流域的合成缺失数据情景。他们的发现表明，当缺失率低于 10% 时，性能下降最小。在数据驱动模型的背景下，研究主要集中在填补数据缺失的策略上。这些方法利用外部来源，如基于物理过程的预测（Zhong 等，2024）、遥感数据（Huang 等，2020）或附近站的观测数据（He 等，2025）来维持预测准确性（Arriagada Sanhueza 等，2021）。

然而，现有研究主要关注单独的概念模型或深度学习模型的完整性，这使得难以在不同背景下推广研究结果。实际上，缺失的水文数据很少遵循单一、统一的模式。相反，缺失情况从随机分散到长期连续中断不等。这些模式可能是由各种操作或环境干扰引起的，如极端环境条件（??ra? 等，2025）、设备损坏和故障（Strohmenger 等，2023）或维护不足（Li 等，2025）。虽然流量通常是根据水位-流量关系得出的，但不同流域的可靠性程度差异很大。在一些小流域中，测量数据并不一致共享，或者流量记录依赖于研究团队进行的项目测量，这可能导致流量曲线有效范围狭窄。因此，在特定水文条件下会导致选择性数据遗漏（Vatanchi 和 Maghrebi，2024）。因此，数据覆盖的不确定性普遍存在，模型将使用不完整的观测输入进行应用。系统地研究间歇性径流观测——在不同情景和不同数据丢失程度下——对不同模型的影响仍然是一个关键且未解决的研究需求。未能解决这一差距可能会阻碍开发出能够在现实世界数据约束下可靠运行的强大且易于使用的径流建模框架，特别是在观测数据稀少或基础设施有限的地区。

与以往仅在一个建模范式内研究数据丢失的研究不同，本研究首次跨范式评估了不连续径流记录如何影响基于物理过程、数据驱动和混合模型在系统变化的数据缺失结构下的表现。通过整合三种代表性的采样情景和多个数据可用性水平，该研究建立了一个统一的框架，不仅揭示了每种模型类型的绝对稳健性，还揭示了数据丢失在不同建模架构中的传播机制——从而为在实际数据约束下选择模型提供了实用指导。在这个框架内，我们解决了三个关键问题：（1）模型在不同程度的径流数据丢失下的表现如何？（2）不同的数据缺失模式如何影响模型的预测性能？（3）导致模型性能观察差异的主要因素是什么？该研究将考虑不同地区的 40 个流域，评估选定的模型（基于物理过程的水文模型 XAJ、深度学习模型 LSTM 和两种混合模型 META 和 G-LSTM）在不同数据丢失模式和程度下的表现。

研究区域和数据

本研究选择了位于中国南部、欧洲（德国和法国）以及美国（图 1）的四十个小型流域。这些流域的空间分布和关键属性——包括位置、排水面积和年平均降水量——在表 S1 中进行了总结。为了避免城市化和水力调节（例如大坝和水库运营）等人为活动的影响，仅包括了源头流域。

基于数据完整性的模型性能

为了评估在不同数据稀缺程度下的模型性能，我们采用了最常见的分散且不规则的数据丢失情景（S1）。我们将此情景应用于每种模型，分为三个类别：数据可用性低（0.1–0.3）、中等（0.4–0.7）和高（0.8–1.0）。所有研究流域的模型结果被汇总并集体分析，以确定每种数据丢失程度下的总体性能趋势。

不同模型的适用性

对四种模型在不同数据可用性程度下的全面评估揭示了它们各自的优点和局限性。在数据稀缺的情景下，基于物理过程的 XAJ 模型和使用 XAJ 输出作为训练目标的 META 模型可以保持可接受的预测性能，并有助于减少不确定性。在 S1 和 S2 情景下，模型性能相当，META 略优于 XAJ。然而，当校准数据被限制在有限的流量范围内时……

结论性评论

本研究系统地评估了四种径流预测模型在不同数据可用性程度下的性能，特别关注了缺失观测数据所带来的挑战。通过分析不同数据丢失情景和数据可用性类别下的模型行为，两个关键因素被确定为模型稳健性的关键：训练数据中捕获的水文条件范围以及先验知识或结构约束的整合。

CRediT 作者贡献声明

Jiarui Wu：撰写——原始草稿、软件、方法论、调查。 Conrad Zorn：撰写——审阅与编辑、监督。 Weiru Zhao：撰写——审阅与编辑、可视化、资源、概念化。 Bjorn Klove：撰写——审阅与编辑、监督。 Wen Liu：资源、调查。 Wenzhou Guo：概念化。 Beibei Wang：概念化。 Shengchao Qiao：监督、资金获取。 Chaoqing Yu：监督、资金获取。 Xiao Huang：撰写——审阅与……

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。

摘要

引言

热点排行

新闻专题