融合因果机制的深度学习模型ResAttCauRec显著提升骤旱预测能力
【字体:
大
中
小
】
时间:2025年10月05日
来源:Water Resources Research 5
编辑推荐:
本研究提出一种融合注意力机制与因果信息的深度学习框架ResAttCauRec(Residual Attention Causal Recurrent),通过CNN-LSTM架构捕捉土壤湿度对时空气象变量的依赖关系。该模型将因果模块作为正则化技术,显著提升模型泛化能力与预测性能(F1分数从基准模型0.06提升至0.41),并利用可解释人工智能(XAI)技术揭示骤旱(flash drought)与常态干旱的驱动机制差异,为农业与生态灾害预警提供新范式。
1 引言
干旱传统上被视为持续数月甚至数年的渐进性气候现象,但近年研究发现,在极端大气条件(高温、强风、低湿度等)下,干旱可能因降水不足或蒸发需求增加而快速 intensified,形成具有突发性和高强度特征的"骤旱"(flash drought)。这类干旱对农业、生态系统和社会经济造成 acute 影响,其快速发育特性使得及时预警和有效响应面临巨大挑战。2012年美国中西部夏季骤旱导致当地作物严重受损和经济损失达357亿美元,凸显了提升骤旱认知和预警能力的迫切性。
现有骤旱预测方法主要基于干旱指数、物理过程模型或耦合系统,利用气象和水文参数进行分析。虽然机器学习(ML)和深度学习(DL)方法在长期传统干旱预测中展现出潜力,但针对骤旱预测的研究仍有限。当前研究多集中于区域尺度(如中国和美国),采用逐网格训练策略,且往往忽略某些潜在预测因子。数据驱动的ML/DL方法 primarily 侧重于预测和分类,而非揭示系统内在的 interdependencies。因果推断方法可作为预测性机器学习的有益补充,通过将系统建模为 potential 确定性数学框架来增强理论理解。部分研究通过简单解耦方式将因果分析与ML模型结合用于骤旱预测,但因果分析仅用于识别时空相关驱动因子,并未直接干预ML模型。更多研究表明,将动力系统的额外见解融入数据驱动模型可 substantially 改善模型性能和泛化能力。
本研究引入一种将因果信息模块整合到传统CNN-LSTM(卷积神经网络与长短期记忆网络)主干网络中的 novel 框架,以实现准确的土壤湿度预测(土壤湿度是骤旱最广泛使用的指标之一)。利用该模型,应用可解释人工智能(XAI)技术揭示骤旱 onset 机制,并与常态干旱进行对比。具体而言,我们开发了Residual Attention Causal Recurrent(ResAttCauRec)模型,基于每日时空气象驱动因子图预测土壤湿度,并检验因果模块如何提升模型性能(尤其针对骤旱事件预测)。此外,采用XAI模型解释算法(expected gradients)评估关键驱动因子对骤旱和常态干旱 onset 的贡献。分析揭示了骤旱加速和复杂性增加的 concerning 趋势,强调了其对未来骤旱预测的潜在影响。该基于因果关系的框架将可解释的因果信号引入深度学习模型,enhancing 其性能,并具有扩展到其他极端天气事件(如洪水和热浪)的潜力。
2 模型开发
为增强对骤旱的洞察和预测能力,我们开发了ResAttCauRec模型(图1a)。该模型利用连续15天的各种气候和气象驱动因子时间序列数据(覆盖10×10网格)预测中心点未来7天的土壤湿度。模型架构基于CNN-LSTM主干网络,因其能有效提取时空数据信息。输入数据 structured 为四维数组(序列×通道×高度×宽度),其中"序列"代表时间序列长度,"通道"指示气候和气象 forcing 数量,"高度"和"宽度"定义关注区域(本研究设为10×10网格)。输入首先馈入Attention CNN模块提取空间信息,每个时间帧单独处理以 facilitate 并行计算。平均池化层跟随注意力CNN模块,通过将区域减少到单点将空间信息嵌入通道。重塑后的数据随后传输到因果知情的LSTM模块,负责使用时序数据提取多个驱动因子的 temporal 信息。LSTM模块的最后一个隐藏状态用于通过全连接层提供土壤湿度预测。
ResAtt(Residual Attention)模块作为ResAttCauRec模型中的注意力CNN,负责提取空间信息。本研究采用经典ResNet(Residual Network)架构,以稳定训练和收敛。注意力机制受人类视觉注意力启发,使模型能选择性关注信息丰富的输入特征,减少无关或噪声数据影响。ResAtt模块集成ResNet架构和注意力机制,有效捕捉对骤旱预测至关重要的空间信息。注意力实现遵循Convolutional Block Attention Module(CBAM)原则,给定特征图作为输入,CBAM sequentially 生成跨两个不同维度(通道和空间)的注意力图,产生最终输出。通道注意力聚焦于识别输入通道中"什么"是有意义的,而空间注意力识别"哪里"是信息部分,与通道注意力互补。
Causal Recurrent(CauRec)模块是一种因果知情的LSTM架构,通过将因果关系嵌入传统LSTM单元细胞状态来提取时序信息。CauRec模块将LSTM输入分为两类:传统时变信息(强迫变量)和额外静态信息(因果度)。强迫变量(如温度、降水和压力)作为LSTM单元的时变输入,额外因果信息(视为静态输入)源自气象变量与邻近像素土壤湿度之间的CCM(Convergent Cross Mapping)因果度。该因果度矩阵首先通过全连接层处理以创建初始细胞状态,然后通过跳跃连接与所有后续细胞状态连接,以增强静态信息在整个序列中的影响。在LSTM中,隐藏状态表示短期记忆,细胞状态表示长期记忆。本研究通过使用因果信息初始化细胞状态,并通过跳跃连接在后续细胞状态中强化该信息,使细胞状态捕获并传递 essential 长期信息(特别是全局因果关系)。这种修改使模型能优先处理关键特征,对于模拟土壤湿度波动的 sequential 性质至关重要,从而提升模型对不同驱动因子时间依赖性的理解和预测可解释性。
3 数据与方法
3.1 FLUXNET2015数据集
土壤湿度骤旱对农业和生态系统构成挑战,导致广泛社会经济影响。预测和提前预警这些事件仍然困难。本研究选择FLUXNET2015数据集作为土壤湿度标签的 ground truth,该数据集提供生态系统 level 的气象和生物测量数据,覆盖全球212个站点,最多至2014年超过1,500站点年数据。我们专注于每日土壤湿度观测(SWC_F_MDS_1)作为目标标签。为确保数据质量,过滤掉无效值超过10%或观测时间少于一年的站点,得到156个有效站点,平均覆盖6.5年(1996-2014年)。应用线性插值处理两个站点(CA-Gro和CA-Oas)的数据缺口。
骤旱事件从土壤湿度观测中基于快速 onset 强化速率识别。典型骤旱事件特征为土壤湿度从40th百分位下降至20th百分位,平均下降速率不低于每天1个百分位;否则事件被分类为常态干旱。百分位在整个观测周期内定义以允许绝对土壤湿度变化比较。土壤湿度超过40th百分位的最后一天标记为 onset 点。干旱条件开始于土壤湿度首次低于20th百分位的点,结束于最后一次高于20th百分位的点。此外,onset 期间的强化速率数学定义为百分位对应时间的变化率。事件 with 强化速率不低于每天1个百分位被识别为骤旱,否则为常态干旱。短期土壤湿度波动可能 artificially 将单一干旱事件分割为多次发生,为解决此问题,要求土壤湿度必须超过20th百分位阈值并保持在该水平以上至少一个候(5连续天)才认为干旱事件终止。使用该定义, across 131个站点共识别892个骤旱事件。所有识别干旱事件持续超过14天,与常用定义(要求干旱条件持续至少三个候或2周)一致。
3.2 ERA5再分析数据
为满足干旱风险管理需求,采用ERA5再分析数据集提供近实时、无间隙气象图作为模型输入。ERA5由欧洲中期天气预报中心(ECMWF)生产,是研究全球大气和地表条件的 state-of-the-art 资源,具有高空间和时间分辨率(0.25度网格和小时间隔)。本研究选择12个变量评估和预测土壤湿度 dynamics,包括2m露点温度(DewT)、2m平均和最高温度(MeanT、MaxT)、对流可用势能(CAPE)、降水(Prec)、蒸发(Evap)、表面压力(PSFC)、相对湿度(Humid)、500hPa位势高度(Z500)、10m风速分量(Wind)以及土壤温度和水分(SoilT、SoilW)。ERA5数据集提供10m u和v风速分量(向东和向北分量),本研究从中通过矢量加法导出绝对风速,忽略方向信息。
气象驱动因子的选择基于其对土壤湿度 dynamics 和骤旱 onset 的 established 影响。气温影响蒸散速率和土壤干燥,露点温度作为大气水分可用性指标影响蒸发需求。降水是土壤湿度补给的主要来源,而蒸发和相对湿度调节水分损失至大气。这些水和温度相关变量与骤旱发生 recurrently 关联。表面压力反映影响降水和水分输送的大尺度大气条件。Z500代表与干旱形成相关的中对流层环流 patterns。CAPE指示大气不稳定性,影响对流降雨和 subsequent 土壤湿度变化。压力驱动风通过增强蒸发和改变水分输送直接影响表面干燥。最后,土壤温度和土壤水分直接 govern 土壤湿度保持和能量平衡,对预测土壤湿度和干旱演变至关重要。
预测范围设为7天,遵循前人研究。该时间框架允许对新兴土壤湿度异常及时管理干预,特别是在骤旱发展的关键早期阶段。此外,进行 lead-time 敏感性分析以说明模型在不同预测范围(从1天到2周)下的性能。为确保模型捕获足够空间信息,从原始数据集中提取围绕目标站点的10×10网格(0.25度分辨率)的每日数据作为模型输入。选择15天输入窗口基于前人研究(输入长度从10天到17候), particularly 用于短中期预测任务。对该超参数进行敏感性分析以讨论输入特征长度对骤旱预测的影响。
3.3 收敛交叉映射(CCM)用于因果发现
水文学领域近几十年涌现多种从观测数据推断因果关系的方法, broadly 分为四类:基于线性和非线性自回归建模(如Granger因果和传递熵)、基于图的技术(如Peter-Clark算法)以及基于时间延迟嵌入理论的方法(如收敛交叉映射,CCM)。前三种方法假定系统 primarily 随机,而CCM基于动力系统理论,将因果关系视为源于底层确定性相互作用。
CCM专门设计用于识别复杂系统中的非线性、状态依赖因果关系。与基于随机性的方法不同,CCM使用Takens定理重建系统吸引子,允许推断变量间弱或间接关系下的因果关系。此外,CCM能区分直接因果相互作用和由共享外部 forcing 引起的 apparent 相关。陆地-大气相互作用驱动地球表面水和能量预算,由多个耦合微分方程 govern。在这些相互作用中,土壤湿度在分配能量和水通量中起关键作用。然而,底层 dynamics exhibit 非线性和弱耦合行为,常显示混沌特性,使其难以使用纯观测数据分析。由于相空间重建能有效捕获此类确定性动力系统特性,CCM为量化该背景下的因果关系提供比假定随机性的方法更合适的框架。
CCM的基本原理涉及从两个时间序列变量重建系统状态,然后使用最近邻预测量化它们之间的因果关系。通常使用时滞嵌入方法生成的阴影流形,因为我们不知道系统的真实流形。给定Takens定理,时滞嵌入使用单个时间序列的连续滞后计算阴影流形,这些流形可与系统真实流形以1:1对应交叉映射。阴影流形可视为变量的 summaries。在X导致Y的系统中,X的信息嵌入Y中。CCM使用单纯形投影估计Y从X,即预测的准确性可作为因果性的度量。此外,CCM中的收敛意味着对于具有因果性的变量,时间序列越长,预测性能越好。
具体地,给定两个时间序列,检查X是否强制Y,首先进行X的相空间重建:使用X的E个连续滞后(每个 separated by 时间步长)进行E维重建。嵌入维度E的值取决于系统复杂性、时间序列长度和噪声等因素,可通过搜索算法优化识别(本研究通过网格搜索设为2)。由于大多数时间序列在时间上不过度采样,固定时间滞后=1。然后X的阴影流形可定义为滞后向量。从选定向量中,找到最近邻。Y的预测模型可给出为权重计算基于欧几里得距离。如果X导致Y,估计期望收敛到Y(t),因为更密集的E+1点簇将用于预测。因此,可绘制估计与Y(t)之间的相关系数检查显著性和收敛性。
本研究中,评估训练数据集中气象变量与土壤湿度之间的双向因果关系。由于FLUXNET站点与ERA5网格单元不完全对齐,将每个站点与四个最近ERA5像素配对以最小化空间不匹配和潜在偏差。该过程仅用于计算局部因果度,而非模型输入(仍基于周围10×10网格单元)。从这四个像素的相关系数及其显著性水平组合成因果度矩阵,然后馈入全连接层生成静态信息。该方法通过跳跃连接增强LSTM细胞状态中持久因果信号的表示,强化整个序列中物理合理驱动因子的影响。
3.4 模型实现与训练
本研究提出的ResAttCauRec模型在全局ERA5和FLUXNET数据集上训练。对于每个站点,时间序列按时间顺序分为训练、验证和测试数据集,比例70:15:15。验证集用于监控训练过程,选择在验证集上表现最佳的模型以有效防止过拟合。测试集保留用于最终评估模型泛化能力。为促进模型收敛,对所有输入特征应用z-score归一化,归一化参数(均值和标准差)仅从训练数据集计算,随后应用于验证和测试数据集以避免数据泄漏。尽管样本具有序列性质,但通过将输入特征(维度15×12×10×10)和相应标签(长度1)配对,然后在三个数据集中独立洗牌,确保样本独立性。
模型架构超参数(如卷积和循环模块的层数)基于性能和模型复杂性之间的权衡选择。由于有限计算资源,无法进行 exhaustive 超参数搜索。相反,通过经验测试手动调整架构, guided by 通用启发式如十倍规则和缩放定律。ResAttCauRec模型的详细参数大小提供在支持信息S1的表S2中。
训练超参数定义模型在训练期间的学习方式。其中,学习率和批量大小共同强烈影响收敛行为和训练稳定性。实验不同批量大小(32到512)和学习率(1e-4到1e-1)组合以识别最优设置。基于收敛性能和计算效率,选择批量大小512和学习率1e-4。使用Adam优化器进行模型训练,因其自适应学习率使其通常对其他优化算法初始学习率选择 less 敏感。训练周期数作为超参数优化以防止过拟合。模型训练50个周期,每个周期处理约260,000个样本。选择在验证数据集上实现最佳性能的周期用于后续评估和分析。该训练过程在单个NVIDIA GeForce RTX 3060 12G上耗时约5.5小时。此外,进行10次独立训练运行以确保结果稳健性和稳定性。
上述数据集划分方案允许评估模型的时间泛化能力。但其对其他具有不同气候条件和土壤特性区域的适用性仍未充分评估。为解决该限制并提供模型空间泛化能力的更全面评估,使用空间蒙特卡洛交叉验证方法,涉及五个独立随机分割(70%训练,15%验证,15%测试)。五个测试集的平均性能作为模型空间泛化能力的稳健估计。
3.5 消融研究与指标
进行消融研究以评估ResAttCauRec模型的有效性。通过移除因果模块,得到ResAttRec模型。进一步移除注意力模块得到ResRec模型,作为基本CNN-LSTM主干。基准Rec模型是基本LSTM模型,仅关注监测站点附近观测序列,忽略更远网格的空间信息。
消融模型并非 fully 独立,它们作为ResAttCauRec的组件或简化版本。因此,必须包含具有 distinct 架构的独立基准模型以更清晰展示所提方法的优势。U-Net作为经典基于CNN的架构,最初设计用于图像分割,已广泛用于地球科学应用(如大气河流检测、降水预测以及骤旱识别)。本研究中,实现修改的U-Net模型作为基准。它保留标准编码器-解码器结构,具有用于下采样的卷积编码器和用于上采样的对称解码器。为使U-Net适应土壤湿度回归任务,将Conv2d层替换为Conv3d层以容纳时间序列。此外,在末尾附加全局平均池化层和全连接层,使模型输出标量值。卷积层的特征大小设为[24,32,40,64],确保可训练参数总数(848,473)与ResAttCauRec模型(839,961)相当。
均方误差(MSE)是回归任务最广泛使用的损失函数。本研究中利用MSE作为训练模型的损失函数和评估性能的标准。MSE对较大误差比较小误差赋予更大权重,意味着更严重惩罚异常值。它也称为L2范数或欧几里得距离。MSE测量模拟值与实际观测之间的平方差平均值。均方根误差(RMSE),即MSE的平方根,也被本研究使用。
Nash-Sutcliffe效率系数(NSE)是地球科学 popular 标准,量化模型模拟预测结果的效果。NSE定义基于观测平均值,范围从负无穷到1。NSE越接近1,模拟结果越好。Kling-Gupta效率(KGE)基于NSE分解为其组成成分(相关、变异性偏差和均值偏差), increasingly 用于模型校准和评估。KGE=1表示完美模拟。
泛化能力(GA)是数据驱动模型的关键问题,指示模型转移到新数据集时保持强性能的能力。相关标准通过比较模型在测试集和训练集上的性能评估该方面。如果GA值超过1,认为模型训练不足或欠拟合;反之,如果GA值小于1,认为模型过度训练或过拟合。虽然过拟合通常应最小化,但深度学习模型中 moderate 程度的过拟合可被容忍,尤其当与正则化和交叉验证等技术平衡时。然而,欠拟合通常不受欢迎,因它表明模型未能捕获数据中的 essential 模式。因此,当GA值小于1时,越接近1,模型泛化越好。
期望模型基于土壤湿度模拟有效识别骤旱事件。干旱事件预测涉及分类而非回归。使用四个指标评估分类质量:准确率、精确率、召回率和F1分数。这些指标基于真正例(TP)、真负例(TN)、假正例(FP)和假负例(FN)计算。准确率定义为所有正确分类的比例(无论正负)。在样本 across 所有类相似的平衡数据集中,准确率可作为模型质量的粗略度量。然而,当处理极端事件(占总天数 small 比例)时,高准确率分数可能误导。召回率(也称为真正例率)数学定义为实际正例中被正确识别的比例。召回率表示检测概率,指示模型检测到的骤旱事件 fraction。精确率则是所有正预测中实际为正的比例。精确率随着假正例减少而提高,召回率随着假负例减少而提高。然而,假正例和假负例常 exhibit inverse 关系,导致精确率和召回率之间的权衡。为平衡该权衡,F1分数源自精确率和召回率的调和平均值。该指标平衡精确率和召回率的重要性,使其对于类不平衡数据集优于准确率。当精确率和召回率值相似时,F1分数也接近该值;当它们明显不同时,F1分数类似于两者中较低的那个。
3.6 基于XAI的模型解释
必须采用可解释人工智能(XAI)技术以深入了解潜在驱动因子与土壤湿度之间的隐含线性或非线性相互作用,从而增强对骤旱机制的理解。本研究中,利用Expected Gradients(EG)方法(作为Integrated Gradients(IG)方法的扩展)进行模型解释。EG细节可在支持信息S1的文本S1中找到。
给定本研究中特征EG值的时空组件,跨时空网格聚合EG值以表示特征i的整体贡献。特定特征的 positive EG值表示其相对于基线预测增加预测值的作用,而 negative EG值暗示相反。
基于EG值得出的特征重要性分数,我们量化不同干旱 onset 强化速率下事件特定特征重要性的变异性,称为干旱复杂性。该指标捕获 underlying 干旱 onset 物理过程的异质性,具有 varying 强化速率。具体地,干旱复杂性定义为在干旱事件 onset 期间 substantially 影响土壤湿度 dynamics 的关键驱动特征数量。关键驱动因子识别为绝对EG值超过80th百分位阈值的特征。此类关键特征的每日计数用于表征每天的复杂性。对于每个干旱事件,将该每日计数在 onset 期间平均得到事件级干旱复杂性度量。更高的复杂性值表明更多方面气象驱动因子组合 contributing to 干旱 onset。
4 结果与讨论
4.1 土壤湿度预测
图3a和3b显示ResAttCauRec模型的损失曲线。值得注意的是,验证损失在前35个周期与训练损失 parallel 下降。然而,在最后15个周期,验证损失稳定而训练损失继续下降,表明过拟合 onset。保留在50个训练周期内实现最佳验证性能的模型用于后续分析。为评估整合到CNN-LSTM主干中的注意力和因果模块的贡献,进行消融研究。通过连续移除这些模块,得到简化变体:ResAttRec、ResRec和基准Rec模型(标准LSTM)。此外,实现U-Net模型作为独立基准。尽管ResAttCauRec模型在训练集上表现较低,但在测试集上 consistently 优于简化模型和基准, underscoring 添加模块的有效性。图3f进一步强调ResAttCauRec模型实现平均泛化能力分数0.83,明显高于ResAttRec(0.43)、ResRec(0.38)和U-Net(0.38),仅略低于Rec模型(0.90)。
结果表明基准Rec模型部分捕获土壤湿度 dynamics 的时间信号,提供相对可靠预测,该发现得到前人研究支持。空间信息提取器(即残差块)的 incorporation substantially 增强模型性能;然而,该额外空间信息仅导致测试数据集上NSE增加0.15。相比之下,训练集上NSE增加0.33, primarily 由于与空间模块相关的广泛模型参数。
为 bridging 训练和测试集之间的模型性能差距,正则化技术对于防止过拟合和增强泛化能力至关重要。注意力的引入改善模型泛化,平均GA从0.38(ResRec)增加到0.43(ResAttRec)。该改进可归因于测试集性能提升而非 merely 缓解训练数据过拟合。此外,观察到基于Conv3d的U-Net基准实现与基于CNN-LSTM的ResRec模型相当性能。这与前人发现一致,即Conv3d架构通过同时卷积空间和时间维度有效捕获时空依赖性。Bai等人也报告 well-designed 卷积模型在序列建模任务中可与循环模型表现相当。
结果表明因果模块作为正则化技术增强模型泛化。与注意力模块(使模型能分配不同权重到不同空间位置)不同,因果模块设计为提供特征维度的显式策略加权,鼓励后续LSTM层优先处理关键特征。这通过训练集上NSE度量下降(从ResAttRec的0.95到ResAttCauRec的0.90,平均)和测试集上增加(从0.72到0.84,平均)证明。ResAttCauRec模型 exhibit 与Rec模型相似的泛化,平均GA为0.83,同时在未见数据上实现 substantial 改进。这表明提出的ResAttCauRec模型有效平衡模型复杂性和泛化。此外,结果 highlight 用基于因果关系的信号指导数据驱动模型的潜在 benefits, particularly 对于动力系统如土壤湿度。
为更全面评估模型的空间泛化能力,进行空间蒙特卡洛交叉验证。与时间分割(测试数据来自与训练数据相同空间分布)不同,空间交叉验证强制模型在完全未见位置进行预测。训练期间,观察到验证损失波动更大(与时间分割场景相比),表明数据分布中更高的空间不确定性和异质性。这是预期的,因为地球物理过程(如土壤特性、土地覆盖或微气候条件)影响骤旱可能跨区域显著变化,使泛化更困难。总体,空间交叉验证下模型性能在所有评估指标上略低。这与前人研究一致,表明空间交叉验证代表模型性能的下界估计,因需要空间外推到训练域之外。尽管如此,提出的ResAttCauRec模型实现平均GA分数0.84,与时间分割场景相当,表明模型保持跨空间强泛化能力。
4.2 骤旱预测
尽管前人研究专注于土壤湿度预测并使用各种模型取得可接受结果,如Y. Cai等人和Kornelsen和Coulibaly,但有限研究报道这些模型用于干旱事件警报的应用。数据驱动模型, particularly 那些在大型数据集上训练的,倾向于优先处理最频繁模式。该偏差使它们在正常条件下表现良好,但可能导致罕见事件(如骤旱) underperformance。
图4说明 proposed 模型用于干旱事件识别的连续土壤湿度预测。以站点BE-Vie(比利时Vielsalm)的4年土壤湿度监测数据为例,出现年度干旱发生模式,干旱事件通常7月开始10月结束。基准Rec模型的预测 exhibit 整体 upward 偏差,未能有效跟踪周期性变化。相反,ResAttCauRec模型成功捕获几乎所有干旱事件, except 一个发生在2020年9月的骤旱事件,期间模型 slightly 高估土壤湿度水平。值得注意的是,2020年9月的骤旱事件并未显示极低土壤水分含量,而是值接近干旱条件阈值(20th百分位)。该阈值附近的 slight 偏差导致 substantially 不同的分类结果。
图4b中,在站点US-Me2(美国Metolius)观察到类似现象,每日最小土壤水分含量约10%。虽然大多数常态干旱事件被正确识别,但2010年7月发生 mismatch:预测干旱事件紧密跟随实际事件但未时间重叠。尽管分类存在 discrepancy,预测土壤湿度与期间观测值紧密匹配。分类对特定阈值的该敏感性 underscore 与干旱早期预警系统相关的挑战。
尽管ResAttCauRec模型在土壤湿度回归中实现强性能(如 consistently 较低测试集误差和较高GA值),它在准确捕获骤旱事件方面 exhibit even greater 相对优势。如表1所示,所有五个模型的准确率与其拟合能力 closely 相关。ResAttCauRec模型在测试数据集所有天的分类中实现最高整体准确率0.87。然而,它并不具有压倒性优势;无干旱类别贡献55,700日历天的79.11%, noticeably 影响模型准确率。即使基准Rec模型在此类场景中表现良好,实现F1分数0.84而无极端土壤湿度值。这些模型之间最明显差异出现在骤旱事件分类中。
值得注意的是,基准模型难以识别骤旱的 onset 期。Rec模型的三个指标徘徊 around 0.06,表明近所有(93%)骤旱 onset 天被错误识别,且近所有(96%)预测骤旱 onset 天不准确。该低效和高风险预测对骤旱事件警报无用。相反,ResAttCauRec模型 exhibit 相对好的骤旱事件分类性能,及时成功识别约39%的骤旱 onset 天,该类别正预测准确率44%。提出的模型在每个站点的详细分类性能呈现于支持信息S1的表S3中。
ResAttRec、ResRec和基准U-Net模型显示相似分类性能。尽管这些模型在预测连续土壤湿度值能力不同,它们的回归性能与分类准确率非 linearly 相关。该 discrepancy 出现因为回归和分类捕获模型行为的不同方面,并使用 distinct 指标评估。为 further 评估分类性能稳健性,增加和减少干旱起始和结束点的土壤湿度阈值。支持信息S1的表S4中总结的结果揭示提出的ResAttCauRec模型与其他模型之间的性能差距与表1中观察到的一致。
此外,预测的 lead time greatly 影响模型性能。支持信息S1的表S5呈现提出的模型在不同提前时间(从1天到2周)下的分类性能。模型实现 substantial 改进(0.16-0.17)在干旱 onset 和
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号