WaveST-Mamba:一种结合小波变换(Wavelet Transform)与Mamba算法的联合框架,用于在时空天气预报中捕捉稳定和波动的模式

《Engineering Applications of Artificial Intelligence》:WaveST-Mamba: A joint framework of wavelet transform with Mamba for stable and fluctuating patterns in spatio-temporal weather forecasting

【字体: 时间:2026年01月03日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  本文提出基于小波变换与Mamba模型的联合框架WaveST-Mamba,通过分离时空数据中的低频稳定模式和高频波动模式,分别采用定制化Mamba模块(SELM/EGSM/SEGM/RPM)建模全局与局部时空依赖,并设计双频混合门融合特征,有效避免单一模式学习的虚假关联问题,在WeatherBench和NARR数据集上显著优于现有方法。

  
肖亚东|季俊忠|雷明龙|王慕华|余婷钊
北京工业大学人工智能研究所计算机科学学院,北京,100124,中国

摘要

天气条件的时空演变过程受到稳定模式和波动模式的驱动。然而,现有的天气预报方法通常依赖单一模式来学习时空特征,这可能导致引入虚假的时空依赖性并影响预报性能。为了解决这个问题,基于小波域中稳定模式和波动模式分别存在于低频和高频分量中的洞察,我们提出了一个结合小波变换和Mamba的联合框架,用于时空天气预报。具体来说,该方法首先执行离散小波变换,分别获得时间和空间维度上的低频和高频分量。然后,在时间维度上,提出了一种时间学习器,通过定制的滑动增强型长期Mamba(SETM)和能量引导型短期Mamba(EGSM)从时间低频和高频分量中捕获长期稳定趋势和短期波动动态。在此基础上,设计了一个时间频率混合门(FMG),以自适应地结合这两种特征,从而产生与真实时间特征一致的时间特征。同时,在空间维度上,构建了一个空间学习器,利用定制的滑动增强型全局Mamba(SEGM)和区域感知Mamba(RPM)分别建模空间低频和高频分量中隐藏的全局和局部空间相关性。此外,还使用了一个空间频率混合门(FMG)动态聚合这些特征,以获得具有全面空间感知能力的空间特征。在两个全球高分辨率天气数据集上的广泛实验表明,该方法的性能优于主流方法。

引言

天气预报旨在利用历史天气条件来研究天气变化的规律性模式。它在人类生活的各个方面发挥着重要作用,有助于农业、交通和能源领域的决策制定,并确保公共安全(López-Ortiz等人,2025年;Gneiting和Raftery,2005年)。准确的天气预报使我们能够及时采取行动,避免潜在的危险。
目前,解决天气预报问题主要有两种范式:传统的数值天气预报(NWP)方法和基于深度学习(DL)的数据驱动方法。NWP通过构建和求解一系列基于物理的偏微分方程来预测未来天气条件(Gagne等人,2014年;McGovern等人,2017年),其解具有很强的理论特性,并为许多大气过程提供了可解释性。然而,NWP通常涉及求解复杂的微分方程,计算成本较高。由于这些限制,基于DL的数据驱动天气预报方法受到了越来越多的关注。与NWP不同,这些方法专注于直接发现隐藏在天气数据中的时空演变模式,而不是依赖复杂的物理方程(Ji等人,2025年)。这一显著优势使它们逐渐成为天气预报任务的主流方法。
在基于DL的数据驱动方法中,它们通常将天气预报问题视为时间序列预报和时空预报任务。前者(时间序列预报)通过各种神经网络(例如循环神经网络(RNNs)(Wang等人,2019年;He等人,2022年;Seo等人,2018年)、Transformer(Zhou等人,2021年;Zhang和Yan,2023年;Wu等人,2021年)和傅里叶分析网络(FANs)(Zhou等人,2022年)等)来分析和捕获天气变量的时间依赖性。然而,地球上的地理位置也对天气条件有不可忽视的影响。因此,后者(时空预报)进一步考虑了多个区域之间天气变量的空间相关性。一些工作在图神经网络(GNNs)中插入了线性条件卷积核,使模型能够更好地适应天气系统的不规则图结构(Ji等人,2025年;Lin等人,2022年)。这种类型的方法倾向于仅使用低频稳定信息来编码时空相关性。然而,实际上,天气条件的时空演变过程是由稳定模式和波动模式决定的(Feng等人,2013年),这使得它们难以区分天气波动模式。与之不同,基于超图的方法(Miao等人,2024年)有助于识别天气波动动态。然而,超图网络的局部性质使其无法发现全局时空信息。总之,上述方法仅使用单一模式(稳定或波动)来发现时空依赖性,可能导致引入虚假的时空相关性,并生成与真实演变模式不一致的时空特征。
最近,Mamba的出现为构建时空相关性提供了有希望的解决方案。它已广泛应用于多个领域,包括自然语言处理(Lenz等人,2025年;He等人,2025年;Patro和Agneeswaran,2025年)、计算机视觉(Ma等人,2024年;Liu等人,2024年;Zhu等人,2024a年;Li等人,2025年)和推荐系统(Zhang等人,2025年;Huang等人,2025年)等。Mamba以状态空间模型(SSM)为核心架构,并结合选择性扫描(S6)和数据依赖参数,实现了线性复杂度下的时空相关性。受此启发,我们尝试将Mamba引入天气预报任务,同时模拟隐藏在稳定和波动模式中的时空相关性,从而克服了现有方法仅依赖单一模式学习时空特征的局限性。然而,这并非易事,面临两个关键挑战:(1)对于变化较小的稳定模式,每个时空点往往表现出相似的天气条件,导致Mamba难以准确区分显著的时空相关性;(2)波动模式具有稀疏性,即天气波动仅发生在局部区域和少数时间点,在大多数情况下保持稳定或没有显著变化。如果直接在波动场景中应用普通的Mamba,很容易引入过多的冗余信息甚至虚假的时空依赖性。
基于上述分析,我们提出了WaveST-Mamba,这是一个结合小波变换和Mamba的联合框架,用于时空天气预报中的稳定和波动模式。该方法基于小波域中的一个关键洞察,即稳定模式存在于低频分量中,而波动模式存在于高频分量中。在此基础上,我们探索了定制适用于天气场景的Mamba,以专门建模隐藏在低频稳定模式和高频波动模式中的内在时空演变特征,使我们的模型能够捕捉天气系统的全面和真实的时空演变过程。具体来说,该方法首先使用离散小波变换将天气数据分解为时间和空间维度上的低频和高频分量。然后,在时间维度上,提出了一种双分支时间学习器,通过定制的低频调制长期Mamba(SELM)和嵌入的能量引导滤波器机制短期Mamba(EGSM)同步捕获时间低频和高频分量中隐藏的长期趋势和短期波动动态。在此基础上,设计了一个时间频率混合门(FMG),以进一步自适应地结合这两种特征,产生与真实时间动态一致的时间特征。同时,在空间维度上,空间学习器利用基于滑动增强策略的全局Mamba(SEGM)和区域感知Mamba(RPM)来建模全局和局部相关性。此外,还使用了一个独立的空间频率混合门(FMG)来生成具有全面空间感知能力的空间特征。最后,时间和空间特征被无缝融合,以准确预测未来的天气条件。本研究的主要贡献总结如下:
  • 我们提出了一个结合小波变换和Mamba的联合框架,用于时空天气预报中的稳定和波动模式,首先引入Mamba来模拟隐藏在天气数据的稳定和波动模式中的时空演变特征。这有效地避免了引入虚假的时空相关性,使我们的模型能够更好地适应复杂的天气系统。
  • 提出了一种时间学习器,通过两个特别定制的Mamba网络同时捕获时间低频和高频分量中隐藏的长期和短期时间特征。这种设计强调了长期趋势和短期波动在天气预报中的共同作用,从而捕获与实际演变动态一致的时间表示。
  • 构建了一个空间学习器,它整合了适应天气场景的全局和局部Mamba,以编码空间低频和高频分量中的空间相关性。这使该方法具有多尺度分析能力,从而能够捕捉具有全局和局部感知能力的空间特征。
  • 在两个全球高分辨率天气数据集上进行了广泛的实验。通过与主流方法的比较,验证了模型的有用性和有效性。
本文的其余部分组织如下:第2节全面回顾了小波分析、状态空间模型和天气预报方法。第3节详细介绍了本研究的动机和方法论。第4节展示了在两个全球高分辨率天气数据集上的丰富实验结果,以证明所提出方法的有效性。第5节总结了结论并提供了未来研究方向的见解。

节选

小波分析

离散小波变换(DWT)是一种广泛使用的信号处理技术。它通过特定的缩放函数和小波函数从时间(或空间)信号中提取低频和高频分量,其中低频分量捕获稳定趋势,而高频分量反映波动动态。由于这些特性,DWT已成为许多领域中不可或缺的工具,如序列推荐和时间序列

方法

在本研究中,我们提出了一个结合小波变换和Mamba的联合框架,用于时空天气预报中的稳定和波动模式,其概要如图1(a)所示。它首先通过DWT将天气数据分解为时间和空间维度上的低频和高频分量。随后,将这些频率分量输入时间和空间学习器。其中,时间学习器旨在捕获长期趋势和短期

实验

在本节中,我们在WeatherBench和NARR数据集上进行了广泛的实验,以回答以下五个研究问题(RQs):
  • RQ1:超参数对WaveST-Mamba的敏感性如何?
  • RQ2:WaveST-Mamba中的关键模块有何影响?
  • RQ3:WaveST-Mamba的性能是否优于现有的最佳基线方法?
  • RQ4:
    所提出的模型在每个时间步骤上的性能是否优于基线方法?
  • RQ5:
    每个区域的预测是否比竞争基线更准确?

结论与未来工作

在本研究中,我们提出了WaveST-Mamba,以克服现有天气预报方法依赖单一模式学习时空特征的局限性。我们的方法基于小波域中的一个关键洞察,即稳定模式存在于低频分量中,而波动模式存在于高频分量中。基于此,我们定制了四个改进的Mamba模块,以同步挖掘天气的潜在时空演变特征

CRediT作者贡献声明

肖亚东:撰写 – 审稿与编辑,撰写 – 原稿,软件,方法论,数据整理。季俊忠:撰写 – 审稿与编辑。雷明龙:撰写 – 审稿与编辑。王慕华:撰写 – 审稿与编辑。余婷钊:撰写 – 审稿与编辑。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。

致谢

本研究部分得到了国家自然科学基金研究计划(编号:62276010、61906010)、北京市教育委员会研发计划(编号:KZ202210005009、KM202010005032)和北京市自然科学基金(编号:4222020)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号