通过增强变量间的交互作用和时间依赖性学习来提高潜热通量预测的准确性

《Journal of Hydrology》:Improving latent heat flux prediction via enhanced cross-variable interaction and temporal dependence learning

【字体: 时间:2026年03月28日 来源:Journal of Hydrology 6.3

编辑推荐:

  潜热通量预测方法改进研究提出变量中心图框架结合自适应图卷积网络与循环神经网络,有效捕捉气象因子与地表状态动态耦合,在146个FLUXNET站点验证中显著提升预测精度(R2增3.11%-7.33%,KGE增5.44%-9.15%),开放灌木林IBGT类型提升尤为突出,模型兼具物理可解释性和跨生态系统泛化能力。

  
李庆良|肖启云|李启宇|魏忠旺|戴永久
长春师范学院计算机科学与技术学院,中国长春130032

摘要

陆地表面潜热通量(LE)是全球水循环和地表能量平衡的关键组成部分。预测LE具有挑战性,因为它依赖于陆地表面状态与气象驱动因素之间复杂且随时间变化的耦合关系。尽管深度学习表现出强大的性能,但许多模型将这些驱动因素视为独立的输入通道,并依赖于隐式的特征混合,这可能会削弱它们表示动态变量间相互作用和物理意义反馈的能力。为了解决这一限制,我们提出了一个以变量为中心的图框架,将陆地表面和气象因素视为图节点,并在变量层面直接学习它们之间的相互作用。该框架结合了自适应图卷积网络和循环网络,以捕捉变量间的相互作用和时间依赖性。在146个FLUXNET站点上,所提出的模型优于基线模型,R2提高了3.11%至7.33%,KGE提高了5.44%至9.15%。在开阔灌木地IGBP类别中,R2从基线的0.382提高到了基于GCN的模型的0.613,KGE提高了多达13.09%。可解释性结果表明,该模型学习了具有物理意义的行为,包括土壤湿度控制和能量反馈。与纯时间基线模型相比,它在不同生态系统中的泛化能力也更强,表明学习变量层面的交互结构有助于更好地外推到未见过的植被类型,并在多样的陆地表面条件下增强LE预测。

引言

陆地表面潜热通量(LE)代表了陆地表面与大气之间的能量交换,这种交换伴随着水的相变(Pierrehumbert, 2002),主要是蒸发和凝结(Liang et al., 1999)。它是全球水循环的基本组成部分(Oki et al., 2004),并与碳循环(Zeng et al., 2017)和地表能量分配(Wang and Dickinson, 2012)紧密相关。通过控制陆地表面的水汽释放,LE影响大气中的水分传输、环流和降水过程,从而影响区域气候和水文。因此,准确的LE预测对于提高我们对陆气耦合的理解以及实现干旱监测和预警等实际应用至关重要(Pereira et al., 1999)。
现有的LE预测方法通常分为三类:基于物理的模型、卫星遥感反演和数据驱动方法。基于物理的模型建立在微气象理论(Monteith, 1965)和地表能量平衡公式(Xiong et al., 2023)的基础上。在陆地表面模型中,LE是通过求解耦合的水分和能量预算来获得的,关键交换过程通过参数化方案表示(Dai et al., 2004, Liang et al., 1994, Overgaard et al., 2006)。基于物理原理的半经验卫星反演算法通过结合卫星观测和简化的物理关系来估计LE。实际上,它们使用遥感的辐射和植被信息来约束地表能量平衡的各个组成部分,然后通过能量平衡残差或近似蒸散控制的公式来推导LE(Chirouze et al., 2014, Merlin et al., 2014, Minacapilli et al., 2009)。基于物理的模型和卫星反演算法都具有物理可解释性,但它们的性能会随着环境条件和植被功能类型的不同而变化,这导致在区域和全球尺度上可用的LE产品之间存在显著差异(Koppa et al., 2022, Pan et al., 2020)。
数据驱动模型通过学习水文气候预测因子与LE之间的经验关系提供了一种替代方法。这类工作从传统的经验和半经验回归模型(Fisher et al., 2008, Shirzaei et al., 2021, Wang et al., 2010)发展到更先进的机器学习方法(Jung et al., 2019, Jung et al., 2011, Xu et al., 2018),以及最近的深度学习(DL)框架(Wang et al., 2020, Yin et al., 2020)。通过直接从观测数据中学习,这些模型可以利用数据中的统计规律,从而补充基于物理的方法。与依赖于显式机制公式的基于物理的模型相比,机器学习方法通常具有更强的非线性建模能力和更低的计算成本。它们可以捕捉LE与关键陆地表面、气象和植被变量之间的复杂关系。多项研究表明,随机森林和支持向量机等算法在LE预测方面能够取得有竞争力的性能(Xu et al., 2018)。为了提高数据驱动方法的物理一致性,Wang et al.(2025)提出了自注意力影响框架用于蒸散估计,该框架结合了物理约束以提高空间可转移性并减少数据受限区域的不确定性。尽管有这些进展,许多传统的机器学习模型仍然难以捕捉长期时间依赖性和多个驱动因素之间的耦合效应。这一限制降低了它们在精细尺度陆地表面过程建模中的适用性(Xiao et al., 2025)。
为了更好地表示时间动态和多变量相互作用,最近的研究越来越多地采用深度学习模型,特别是循环架构。长短期记忆(LSTM)网络和门控循环单元(GRU)非常适合水文气象时间序列,因为它们的门控机制有助于在较长时间内保持信息(Waqas and Humphries, 2024)。因此,它们被广泛用于LE预测。Yin et al.(2020)开发了一种混合BiLSTM模型,使用有限的驱动变量集实现了准确的短期LE预测,并被应用于智能灌溉系统。Li et al.(2024c)引入了LandBench 1.0基准测试框架,并报告称LSTM模型优于CNN基线和物理模型,1天和5天预测时间的相关性分别达到了约0.83和0.76。Chia et al.(2022)比较了CNN-1D、LSTM和GRU模型在多步预测中的表现,发现具有多输入多输出策略的GRU在整体性能和长期预测稳定性方面表现最佳。Fong et al.(2025)表明,结合遥感变量并将卷积特征提取与循环记忆相结合可以提高性能。
即使在建模时间动态方面取得了这些进展,一个重要的限制仍然在于预测因子的表示和组合方式。许多深度学习模型仍然依赖于特征堆叠,其中气象和陆地表面驱动因素被视为独立的通道并在进入网络之前被连接起来。这种隐式的融合可能会掩盖反映陆气耦合的变量之间的结构化、随时间变化的依赖关系。例如,净辐射通常通过提供可用能量来增加蒸散(Zhang et al., 2017),然而,在土壤湿度(SM)受限的情况下,即使有足够的可用能量,蒸散也受到强烈限制(Seo and Ha, 2022)。因此,像LSTM和GRU这样的纯时间模型可以捕捉LE的序列结构,但它们通常无法表示动态的变量间相互作用及其产生的反馈过程。
图神经网络(GNN)通过将系统表示为由边连接的节点来提供特征堆叠的原理性替代方案,这些边编码了依赖关系,然后通过消息传递来学习这些关系(Scarselli et al., 2008)。这种表述方式比依赖于序列模型内的隐式混合提供了更明确的方式来模拟变量之间的结构化耦合。在环境科学中,GNN主要用于通过连接观测站点或网格单元来捕捉空间依赖性。Li et al.(2023)将基于站的注意力GNN与LSTM相结合,提高了区域热浪预测的准确性。Sudhakara and Bhattacharjee(2024)将GNN层与LSTM集成,以增强印度的SM预测。最近的研究还改进了空间图构建。Gousseau et al.(2025)使用共享边界连接不规则网格上的相邻单元,提高了海冰预测的准确性。Pan et al.(2025)通过皮尔逊相关性识别了长距离连接,并报告了更准确、更稳定的多步SM预测。总体而言,这些研究表明,当空间结构携带持续的预测信号时,空间图学习最为有效。
对于许多陆地表面变量,包括通量,空间图构建的好处并不明显,因为邻近位置在土壤性质、植被和地形方面可能存在显著差异,因此对蒸散和相关通量的控制可能强烈依赖于具体地点(El Maayar and Chen, 2006)。在这种情况下,跨附近节点的消息传递可能会引入无关信号,导致过度平滑,并降低在不同景观中关系的可转移性。这促使我们从空间拓扑转向以变量为中心的图构建方法,其中陆地表面状态和气象驱动因素被视为节点,它们的时间变化相互作用被直接学习,以更好地表示LE预测中的变量间耦合和时间依赖性。
为了解决这些限制,我们引入了一个以变量为中心的LE预测框架,该框架在物理驱动因素上构建图而不是在站点上构建图。气象和陆地表面因素(如温度、辐射和湿度)被表示为图节点,使模型能够直接学习它们之间的依赖关系。我们进一步集成GRU或LSTM来模拟学习到的变量表示的时间演变,并捕捉长期依赖性。总体而言,所提出的方法旨在加强以交互为中心的学习,并支持在不同区域之间的更稳健泛化。

数据

本研究使用的数据集包括FLUXNET2015 Tier 1、AmeriFlux、现代时代回顾分析研究与应用版2(MERRA-2)和LandBench 1.0。通量塔观测是我们的主要数据来源,因为它们提供了基于地面的表面通量和近地表气象测量数据,并且被广泛用于评估数据驱动的陆地-大气交换模型(Pan et al., 2019)。MERRA-2是一个全球大气再分析项目,它整合了卫星数据

基线时间模型:LSTM和GRU

LE是一个非线性动态过程(Li and Avissar, 1994),受到同时发生的陆地表面和气象条件以及与先前状态相关的时间持续性的影响(Lin et al., 2022)。因此,准确表示季节性变化需要能够捕捉长期时间依赖性的深度学习模型。为此,我们使用LSTM和GRU作为基线序列模型,应用于由我们的以变量为中心的图模块生成的时间序列嵌入。

不同植被类型下的性能

图3使用箱线图比较了IGBP植被类型在不同站点上的性能。与基线GRU和LSTM模型相比,所提出的GCNGRU和GCNLSTM在大多数植被类别中通常实现了更高的中位数R2KGE,以及更低的RMSE和更小的偏差幅度。对于许多IGBP类型,基于图的模型还显示出更窄的四分位数范围,表明预测更稳定,同一植被类别内的站点间变异性更小。这些改进表明

变量间相互作用对LE预测的影响

在结合过程理解和深度学习的混合方法中,通常会添加基于物理的诊断变量作为辅助输入,以改善在不同数据条件下的泛化能力(Tanhapour et al., 2025, Yu et al., 2023)。对于LE估计,这些输入通常来自已建立的过程公式,包括空气动力阻力、表面阻力以及总结能量和水耦合的指数(Li et al., 2024b, Monteith, 1965)。

结论

本研究提出了一个以变量为中心的LE预测框架,将变量间耦合作为显式的学习目标,同时保持强大的时间序列建模能力。在146个FLUXNET站点上的评估表明,图-循环模型一致性地优于GRU和LSTM基线模型,在不同植被类型和地区提供了更高的准确性和更大的稳定性。当LE依赖于驱动因素之间的强且随时间变化的相互作用时,改进尤为明显

CRediT作者贡献声明

李庆良:撰写——审稿与编辑、资源、方法论、研究、资金获取、数据管理、概念化。肖启云:撰写——原始草稿、可视化、验证、软件、方法论。李启宇:监督、研究。魏忠旺:验证、正式分析。戴永久:资金获取。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

本研究部分得到了广东省基础与应用基础研究重大项目(资助编号2021B0301030007)、国家自然科学基金(资助编号42575159、42275155、42375144、62206028)以及教育部基础与跨学科学科突破计划(资助编号JYB2025XDXM902)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号