陆地表面潜热通量(LE)代表了陆地表面与大气之间的能量交换,这种交换伴随着水的相变(Pierrehumbert, 2002),主要是蒸发和凝结(Liang et al., 1999)。它是全球水循环的基本组成部分(Oki et al., 2004),并与碳循环(Zeng et al., 2017)和地表能量分配(Wang and Dickinson, 2012)紧密相关。通过控制陆地表面的水汽释放,LE影响大气中的水分传输、环流和降水过程,从而影响区域气候和水文。因此,准确的LE预测对于提高我们对陆气耦合的理解以及实现干旱监测和预警等实际应用至关重要(Pereira et al., 1999)。
现有的LE预测方法通常分为三类:基于物理的模型、卫星遥感反演和数据驱动方法。基于物理的模型建立在微气象理论(Monteith, 1965)和地表能量平衡公式(Xiong et al., 2023)的基础上。在陆地表面模型中,LE是通过求解耦合的水分和能量预算来获得的,关键交换过程通过参数化方案表示(Dai et al., 2004, Liang et al., 1994, Overgaard et al., 2006)。基于物理原理的半经验卫星反演算法通过结合卫星观测和简化的物理关系来估计LE。实际上,它们使用遥感的辐射和植被信息来约束地表能量平衡的各个组成部分,然后通过能量平衡残差或近似蒸散控制的公式来推导LE(Chirouze et al., 2014, Merlin et al., 2014, Minacapilli et al., 2009)。基于物理的模型和卫星反演算法都具有物理可解释性,但它们的性能会随着环境条件和植被功能类型的不同而变化,这导致在区域和全球尺度上可用的LE产品之间存在显著差异(Koppa et al., 2022, Pan et al., 2020)。
数据驱动模型通过学习水文气候预测因子与LE之间的经验关系提供了一种替代方法。这类工作从传统的经验和半经验回归模型(Fisher et al., 2008, Shirzaei et al., 2021, Wang et al., 2010)发展到更先进的机器学习方法(Jung et al., 2019, Jung et al., 2011, Xu et al., 2018),以及最近的深度学习(DL)框架(Wang et al., 2020, Yin et al., 2020)。通过直接从观测数据中学习,这些模型可以利用数据中的统计规律,从而补充基于物理的方法。与依赖于显式机制公式的基于物理的模型相比,机器学习方法通常具有更强的非线性建模能力和更低的计算成本。它们可以捕捉LE与关键陆地表面、气象和植被变量之间的复杂关系。多项研究表明,随机森林和支持向量机等算法在LE预测方面能够取得有竞争力的性能(Xu et al., 2018)。为了提高数据驱动方法的物理一致性,Wang et al.(2025)提出了自注意力影响框架用于蒸散估计,该框架结合了物理约束以提高空间可转移性并减少数据受限区域的不确定性。尽管有这些进展,许多传统的机器学习模型仍然难以捕捉长期时间依赖性和多个驱动因素之间的耦合效应。这一限制降低了它们在精细尺度陆地表面过程建模中的适用性(Xiao et al., 2025)。
为了更好地表示时间动态和多变量相互作用,最近的研究越来越多地采用深度学习模型,特别是循环架构。长短期记忆(LSTM)网络和门控循环单元(GRU)非常适合水文气象时间序列,因为它们的门控机制有助于在较长时间内保持信息(Waqas and Humphries, 2024)。因此,它们被广泛用于LE预测。Yin et al.(2020)开发了一种混合BiLSTM模型,使用有限的驱动变量集实现了准确的短期LE预测,并被应用于智能灌溉系统。Li et al.(2024c)引入了LandBench 1.0基准测试框架,并报告称LSTM模型优于CNN基线和物理模型,1天和5天预测时间的相关性分别达到了约0.83和0.76。Chia et al.(2022)比较了CNN-1D、LSTM和GRU模型在多步预测中的表现,发现具有多输入多输出策略的GRU在整体性能和长期预测稳定性方面表现最佳。Fong et al.(2025)表明,结合遥感变量并将卷积特征提取与循环记忆相结合可以提高性能。
即使在建模时间动态方面取得了这些进展,一个重要的限制仍然在于预测因子的表示和组合方式。许多深度学习模型仍然依赖于特征堆叠,其中气象和陆地表面驱动因素被视为独立的通道并在进入网络之前被连接起来。这种隐式的融合可能会掩盖反映陆气耦合的变量之间的结构化、随时间变化的依赖关系。例如,净辐射通常通过提供可用能量来增加蒸散(Zhang et al., 2017),然而,在土壤湿度(SM)受限的情况下,即使有足够的可用能量,蒸散也受到强烈限制(Seo and Ha, 2022)。因此,像LSTM和GRU这样的纯时间模型可以捕捉LE的序列结构,但它们通常无法表示动态的变量间相互作用及其产生的反馈过程。
图神经网络(GNN)通过将系统表示为由边连接的节点来提供特征堆叠的原理性替代方案,这些边编码了依赖关系,然后通过消息传递来学习这些关系(Scarselli et al., 2008)。这种表述方式比依赖于序列模型内的隐式混合提供了更明确的方式来模拟变量之间的结构化耦合。在环境科学中,GNN主要用于通过连接观测站点或网格单元来捕捉空间依赖性。Li et al.(2023)将基于站的注意力GNN与LSTM相结合,提高了区域热浪预测的准确性。Sudhakara and Bhattacharjee(2024)将GNN层与LSTM集成,以增强印度的SM预测。最近的研究还改进了空间图构建。Gousseau et al.(2025)使用共享边界连接不规则网格上的相邻单元,提高了海冰预测的准确性。Pan et al.(2025)通过皮尔逊相关性识别了长距离连接,并报告了更准确、更稳定的多步SM预测。总体而言,这些研究表明,当空间结构携带持续的预测信号时,空间图学习最为有效。
对于许多陆地表面变量,包括通量,空间图构建的好处并不明显,因为邻近位置在土壤性质、植被和地形方面可能存在显著差异,因此对蒸散和相关通量的控制可能强烈依赖于具体地点(El Maayar and Chen, 2006)。在这种情况下,跨附近节点的消息传递可能会引入无关信号,导致过度平滑,并降低在不同景观中关系的可转移性。这促使我们从空间拓扑转向以变量为中心的图构建方法,其中陆地表面状态和气象驱动因素被视为节点,它们的时间变化相互作用被直接学习,以更好地表示LE预测中的变量间耦合和时间依赖性。
为了解决这些限制,我们引入了一个以变量为中心的LE预测框架,该框架在物理驱动因素上构建图而不是在站点上构建图。气象和陆地表面因素(如温度、辐射和湿度)被表示为图节点,使模型能够直接学习它们之间的依赖关系。我们进一步集成GRU或LSTM来模拟学习到的变量表示的时间演变,并捕捉长期依赖性。总体而言,所提出的方法旨在加强以交互为中心的学习,并支持在不同区域之间的更稳健泛化。