迈向实时高分辨率河流洪水预报:一种基于地表径流模型的稳健替代方法
《Environmental Modelling & Software》:Toward real-time high-resolution fluvial flood forecasting: A robust surrogate approach based on overland flow models
【字体:
大
中
小
】
时间:2025年10月11日
来源:Environmental Modelling & Software 4.6
编辑推荐:
本研究提出融合物理模型与机器学习的混合框架,通过GeoXAI提升可解释性,显著提高洪水预测效率,并在柬埔寨平原验证了其有效性。
随着全球气候变化的影响日益加剧,及时的洪水预测对于降低灾害风险变得尤为重要。传统的基于物理的水动力模型虽然能够准确捕捉洪水动态,但其高计算需求限制了其在实时应用中的可行性。因此,研究者们开始探索将机器学习(ML)与物理模型相结合的混合框架,以实现高效且准确的洪水预测。这类混合方法利用物理模型提供详细的淹没信息,同时借助机器学习模型作为快速的替代预测工具,从而在保证预测质量的前提下显著提升计算效率。
在本研究中,我们选择了柬埔寨的洪水平原作为实验区域,这一地区由于季节性降雨的影响,极易发生洪水。我们采用基于机器学习的替代模型,其训练数据来源于TELEMAC水动力模型的模拟结果。为了增强模型的可解释性,我们引入了可解释人工智能(XAI)技术,用于分析模型的决策过程。实验结果表明,这种混合方法在计算效率上取得了显著提升,同时保持了较高的预测准确性。其中,最佳的替代模型在评估指标上达到了R = 0.97和KGE = 0.91的高值,相较于TELEMAC模型,其模拟时间减少了超过70倍。此外,结合地理特征如纬度和经度进一步提升了预测能力,特别是在地形平坦的洪水平原环境中。
在当前的洪水建模研究中,存在多种主要方法,包括实地调查、遥感技术和基于物理的模型。尽管实地调查方法可以提供接近绝对的精度,但其高成本、需要大量人力以及在大规模洪水事件中的潜在危险限制了其广泛应用。遥感数据近年来受到学者们的广泛关注,因为它们可以在大范围内提供中高分辨率的信息。然而,光学遥感数据(如Sentinel 2和Landsat)在洪水期间常被云层遮挡,导致洪水区域的投影经常出现偏差。合成孔径雷达(SAR)卫星影像数据则被广泛用于解决云层遮挡问题,因为它们可以在各种天气条件下运行。尽管如此,由于洪水动态可能在短时间内发生,这些数据的时间分辨率仍不足以支持实时或近实时的洪水监测。
基于物理的水动力模型在洪水淹没图的构建中具有重要作用,它们通过数学方程和物理原理(如质量守恒定律和动量守恒定律)来描述水流特性,被认为是现实世界的简化表示。许多知名的水动力模型包括HEC-RAS、MIKE-FLOOD和TELEMAC等。这些模型还可以考虑人类活动对地表径流的影响,如土地利用变化和基础设施建设。然而,这些模型的主要缺点是计算资源需求较高,特别是在大规模洪水模拟中。随着技术的发展,科学家们提出了多种方法来提高水动力模型的计算效率,例如使用图形处理单元(GPU)进行计算,或为模型赋予并行计算能力。例如,Buttinger-Kreuzhuber等人(2022)提出了一种整合框架,利用GPU实现高精度模拟和计算加速,其模型在GPU上的运行速度比使用中央处理器(CPU)快了1000倍,使得城市流域的高分辨率洪水模拟成为可能。然而,即使如此,水动力模型在某些情况下仍然无法满足需求,例如需要长时间运行或进行多次模拟以评估不确定性(如蒙特卡洛方法)。
替代模型(也称为元模型)被证明是解决水动力建模计算资源问题的有效方法。替代模型通常分为两类:一类是低保真度的替代模型,它们仍然基于物理原理,但去除了部分复杂组件,专注于基本操作;另一类是响应曲面模型,这些模型通常通过机器学习方法构建,用于近似复杂水动力模型的输入输出行为。在本研究中,我们采用了后者,即基于机器学习的响应曲面模型,其目标是近似水动力模型的输入输出行为。这一选择的动机在于需要大幅降低计算成本,同时保持较高的预测准确性,这对于高分辨率洪水建模、情景分析和不确定性量化等任务至关重要。例如,Zahura等人(2020)发现,使用基于机器学习的替代模型可以将物理模型的计算时间减少3000倍,而Liu和Pender(2015)则提出了一种基于支持向量回归的新型淹没模型,其结果显示,该模型在计算成本上较低,同时保持了与物理模型相当的准确性。此外,机器学习在替代模型中的应用也扩展到了其他领域,如气象预测和环境建模。然而,由于替代模型基于机器学习技术,因此可能会继承一些机器学习模型的限制和约束。特别是在处理高维模型和多个不确定性因素时,训练替代模型需要从原始模型中进行大量泛化,这可能导致维度灾难问题。此外,洪水模型的应用中,模型设置通常需要高分辨率,并涉及与不确定性来源(如降雨量、初始条件或模型参数)相关的多个情景模拟,这使得生成替代模型的训练数据需要大量的计算时间和资源。同时,基于机器学习的替代模型并未显式地整合物理原理,如质量守恒或动量守恒,因此其预测结果可能在某些情况下缺乏物理一致性,特别是在应用条件超出训练数据范围时。
理解模型如何做出预测,往往与了解预测的准确性同样重要。只有当我们了解模型的工作机制,才能在预测结果可能出错时识别并纠正潜在错误,从而避免基于模糊输出做出的错误决策。然而,机器学习模型的准确性和可解释性之间存在权衡。当前,研究者们正在探索多种模型诊断方法,如可解释人工智能(XAI),以揭示机器学习模型的内部机制。在水文学领域,许多研究表明,可解释技术在数据驱动模型中的应用正在迅速增长。然而,尽管取得了进展,可解释技术在替代模型中的应用仍然有限,并处于早期阶段。此外,大多数现有的XAI方法忽略了特征的空间变化影响,而这在环境建模中至关重要,因为空间异质性是常态。这一空白突显了开发能够提供高效预测和空间可解释性的替代建模框架的必要性,这对于洪水风险管理与环境决策具有重要意义。
在本研究中,我们提出了一种新的框架,通过结合基于物理的模拟、机器学习方法和地理可解释人工智能(GeoXAI)来满足这一需求。具体而言,我们设计了一种替代模型,该模型基于有限的网格单元子集进行训练,能够对未用于训练的区域进行插值和外推,以实现细尺度分辨率。这一策略显著提高了训练效率,通过减少生成粗尺度数据集的计算负担。除了效率之外,本研究的创新之处在于将可解释性扩展到空间领域:我们采用GeoShapley值,这是SHAP方法的一种新兴扩展,用于评估输入因素的全局重要性及其空间分布。通过这样做,我们超越了以往基于机器学习的替代研究,这些研究主要关注准确性和全局可解释性,而我们提出了一种能够同时提高计算效率并揭示地理特征对洪水预测的空间异质性影响的框架。
本文的结构如下:第二部分详细介绍了本研究采用的方法论。第三部分描述了用于评估所提出框架的研究区域和实验设置。第四部分展示了实验结果。第五部分和第六部分分别提供了讨论和结论。在研究区域的选择上,我们关注的是柬埔寨的洪水平原,这一地区位于湄公河盆地下游,覆盖了从克雷蒂省到越南边境的整个柬埔寨洪水平原区域。特别需要指出的是,本研究包括洞里萨湖及其生态系统,总面积约为49643.4平方公里。该区域地形平坦,地势低洼,河流水流平缓,因此在洪水模拟中,捕捉细微的空间变化成为一项关键挑战。这些特征使得基于机器学习的替代模型在处理此类地形时面临一定的困难,特别是在仅依靠高程或水文输入的情况下,难以准确区分洪水动态。因此,在本研究中,我们引入了地理信息,如纬度和经度,以提供额外的空间线索,从而增强机器学习模型的预测能力。
在评估TELEMAC模型的性能时,我们使用了不同的曼宁系数组合(如曼宁摩擦系数和曼宁粗糙度系数)在四个选定站点(如金边、Prek Kdam、Kompong Luong和Neak Luong)进行了测试。评估指标包括R、MAE、MSE和RMSE。结果表明,曼宁摩擦系数为0.025和曼宁粗糙度系数为0.020的组合在所有站点中表现最佳,具有最低的MAE、MSE和RMSE值。例如,在金边的RMSE值降低到0.777米,而在Kompong Luong的预测结果也显示出显著的改进。这些结果表明,选择合适的曼宁系数组合对于提高TELEMAC模型的预测准确性至关重要。
在洪水建模中,特别是针对大型洪水平原区域,模型的性能受到多种条件的限制。这些区域通常地形平坦,缺乏明显的地形梯度,使得模型难以仅凭高程或水文输入准确区分洪水动态。因此,在本研究中,我们引入了地理信息,如纬度和经度,以提供额外的空间线索,从而增强机器学习模型的预测能力。这些地理特征在洪水模拟中起到了重要作用,因为它们能够反映不同区域的物理环境差异。通过将这些特征纳入模型,我们能够更准确地捕捉洪水动态的空间分布,提高模型的预测精度。
本研究的结论表明,开发一种将机器学习模型与TELEMAC水动力模型相结合的替代建模框架,能够实现实时洪水淹没预测。主要发现包括:替代模型的性能显著,能够有效模拟由物理模型产生的淹没过程,并提供准确的预测结果;计算效率大幅提升,相较于传统的水动力模型,替代模型能够在短时间内完成大量模拟,从而支持实时洪水预测的需求。此外,结合地理特征如纬度和经度,显著增强了模型的预测能力,特别是在地形平坦的洪水平原环境中。这些结果表明,基于机器学习的替代模型在洪水预测中具有广阔的应用前景,能够有效平衡计算效率与预测准确性。
在软件和数据方面,本研究使用了TELEMAC-MASCARET系统,这是一个开源的水动力建模套件,可以免费获取。此外,我们还使用了scikit-learn库来实现决策树和随机森林模型,这些模型同样可以免费获取。CatBoost梯度提升框架和XGBoost库也被用于本研究,它们分别由Yandex和相关团队开发,并提供相应的开源资源。这些工具的使用使得我们能够高效地构建和训练替代模型,同时确保模型的可解释性。通过这些软件和数据资源,我们能够实现对洪水预测的全面分析,为洪水风险管理提供科学依据。
本研究的作者贡献声明指出,Giang V. Nguyen负责撰写初稿、可视化、软件开发、方法论设计和概念化。Chien Pham Van负责撰写初稿和数据整理。Vinh Ngoc Tran负责撰写初稿和形式分析。Linh Nguyen Van负责撰写初稿。Giha Lee负责撰写初稿的审阅与编辑以及项目监督。此外,在撰写过程中,作者使用了ChatGPT工具来提高文章的可读性和语言表达,随后对内容进行了必要的审阅和编辑,并对最终发表内容承担全部责任。本研究的作者声明没有已知的财务利益或个人关系可能影响研究结果。
最后,本研究得到了韩国国土与安全部(MOIS)资助的“技术创新计划”(项目编号:RS202400398858)的支持,该项目旨在开发用于实际应用的基于人工智能的城市洪水灾害风险预测和评估技术。这一支持使得我们能够进行大规模的洪水模拟和数据分析,为洪水预测提供科学依据和技术支持。通过这些努力,我们希望为洪水风险管理提供更高效、更准确的预测工具,从而减少洪水带来的灾害风险。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号