南海海域海洋热浪预测方法

《Journal of Marine Systems》:Marine heatwave prediction method for the South China Sea

【字体: 时间:2025年10月31日 来源:Journal of Marine Systems 2.5

编辑推荐:

  本文提出基于Transformer的多变量多粒度时空图神经网络(MMS-GNN)用于南海海洋热浪预测,通过时间序列按周期排序、空间邻接矩阵构建和时空特征融合,有效捕捉长时序依赖与多尺度空间关系,实验表明其预测效果优于传统方法。

  海洋热浪(Marine Heat Waves, MHWs)是持续时间较长的异常海水温度现象,对海洋生态系统产生深远影响。准确预测这些现象对于减轻其对环境和社会的负面影响具有重要意义。在本研究中,提出了一种基于Transformer的多变量多粒度时空图神经网络(Multivariate Multi-granularity Spatiotemporal Graph Neural Network, MMS-GNN)模型,以提高长期MHW预测的准确性和灵活性。该模型结合了时间序列处理和空间关系建模,能够有效捕捉复杂的时间依赖性和空间交互性,为海洋热浪预测提供了一种新的方法。

海洋热浪通常被定义为一系列离散的异常暖水事件,其特征包括强度、演变速率、持续时间和空间范围。这些事件对海洋生态系统和服务造成严重影响,如有害藻类繁殖、物种分布变化以及局部物种灭绝等。随着全球变暖的加剧,过去二十年中,海洋吸收了过多的热量,导致海洋热浪的发生频率和强度显著上升,对全球环境和社会产生广泛影响。特别是南中国海地区的珊瑚礁生态系统,近年来经历了明显的退化。由于海洋热浪对珊瑚礁和藻类共生关系的破坏,珊瑚白化现象日益严重,这进一步突显了准确预测海洋热浪的重要性。

海洋热浪的形成受到多种因素的影响,例如海气热通量、太阳辐射和昼夜风等,这些因素共同作用形成了复杂的垂直结构。太阳辐射的变化会影响海面能量平衡,而云层覆盖、大气条件和时间因素则进一步影响辐射平衡,从而对海水温度产生作用。白天的太阳加热可能引发海陆风,促进海水混合,进而影响温度分布;而夜晚的冷却过程则可能成为主导因素。由于海面热辐射和通量的不规则性以及风的不可预测性,建立有效的数学方程来描述海洋热浪与这些因素之间的因果关系变得困难,使得预测工作面临挑战。

目前,海洋热浪的预测方法主要分为两大类:基于物理的数值模型和基于数据驱动的方法。前者依赖于动态和热力学方程,并结合相关的初始和边界条件进行建模。这些模型通过求解偏微分方程(PDEs)来解释物理状态,并进行大量计算以获取如海表温度(SST)等关键参数。然而,由于这些模型难以清晰地解释海洋参数的生成和演变机制,因此往往存在精度不足和计算成本高的问题。另一方面,数据驱动的方法则关注数据的特征和内在模式,通过训练历史样本来学习趋势并进行预测。这些方法包括统计方法、机器学习和深度学习。基于大量可靠观测数据,这些方法可以快速获得令人满意的预测结果。

近年来,机器学习、深度学习和数值再分析技术在海洋热浪预测中的应用不断增加。例如,Sun等人(2023)和Xie等人(2024)使用了U-Net模型进行海洋热浪预测,而Parasyris等人(2025)则应用了注意力增强的卷积神经网络(CNN)对地中海海域的海洋热浪进行分类,结果显示该方法在识别关键区域和提取重要特征方面具有优势。这些方法在捕捉局部短期变化方面表现良好,但在处理多变量、不规则邻接关系和多尺度耦合时存在局限。此外,当预测特定点的时间序列测量值时,还需要考虑与邻近点数据之间的时空依赖性和关系。

在工程和环境领域,多步预测任务通常采用机器学习和深度学习方法来分析观测数据。这些方法被广泛应用于复杂时间序列数据处理场景。例如,Wang等人(2020)提出了一种结合基因表达编程(GEP)模型和自回归条件异方差(ARCH)模型的混合方法,用于多个地点40年的观测流量时间序列建模。该混合方法有效地结合了确定性和随机性模型的优势,从而提高了预测的准确性和可靠性。Molajou等人(2021)则提出了一种将传统遗传算法和优化方法与神经网络结合的混合模型,用于降雨径流预测,通过引入极端时间序列变化的空间信息,提高了预测能力。

在进行时空预测任务时,尤其是处理地球物理数据,理解高维、强时空相关性且数据范围有限的观测数据至关重要。时空数据通常表现出相邻地点之间的空间相关性和相邻时间步之间的时间相关性。因此,使用深度学习方法来建模具有较强时间相关性的序列型时空数据是合适的。尽管循环神经网络(RNNs)和长短期记忆网络(LSTM)等方法常用于时间序列建模,但它们在捕捉不同变量之间的依赖性方面效果有限,特别是在处理高维地球物理数据时,其预测能力进一步减弱。

为了解决这些依赖性问题,研究者们开始采用图神经网络(Graph Neural Network, GNN)技术。GNN是一种高效的机器学习工具,适用于处理非欧几里得结构数据。自GNN引入以来,许多更先进的方法相继提出,如GraphSAGE和图注意力网络(Graph Attention Network, GAT)。在这些方法中,通过递归聚合相邻节点的表示来学习局部结构信息。GNN因其能够直接处理数据而被成功应用于多个领域。

本研究提出了一种基于GNN的深度学习框架(即多变量多粒度时空GNN,MMS-GNN),用于海洋热浪的预测。该模型通过结合Transformer和GNN,能够学习多变量时间序列数据中的时空相关性和依赖性。具体而言,该方法首先对时间序列按照不同的周期进行排序,包括周、月和年等不同粒度的时间序列。通过Transformer捕捉不同时间粒度下的长期依赖关系,从而增强模型对不同时间尺度变化的适应能力。此外,模型还构建了双邻接矩阵,用于表征不同尺度下的空间关系,考虑了相邻节点之间变化趋势所建立的空间依赖性。

在实际应用中,海洋和气象数据表现出复杂的时空关系。有效捕捉和整合这两种关系对于实现准确的海洋热浪预测至关重要。因此,本研究提出了一种分层的深度神经网络模型,该模型能够同时处理时间和空间特征,以完成海洋热浪预测任务。该模型的框架如图3所示,通过将时间序列数据和空间关系数据结合起来,实现了对复杂时空模式的建模。

为了进行模型训练和评估,研究使用了来自美国国家海洋和大气管理局(NOAA)的OISST-V2数据集,该数据集基于先进甚高分辨率辐射计(AVHRR)遥感数据,并采用最优插值(OI)方法对全球高分辨率海表温度(SST)进行估计。OISST数据集的空间分辨率为0.25°×0.25°,提供了较为详细的海表温度信息。此外,研究还采用了ERA5数据集,该数据集由欧洲中期天气预报中心(ECMWF)提供,是第五代大气再分析数据,涵盖了更广泛的气象变量,如风速、风向、温度等。

模型的训练和测试均基于南中国海的40年观测数据,涵盖了多个关键变量,如海表温度、风速、风向和空气温度等。这些数据提供了丰富的时空信息,使得模型能够更全面地理解海洋热浪的形成机制和演变过程。通过引入多粒度时间序列排序和双邻接矩阵,MMS-GNN模型能够更有效地捕捉不同时间尺度和空间尺度下的依赖关系,从而提升预测的准确性。

在实验结果方面,MMS-GNN模型在南中国海的海洋热浪预测任务中表现出优于其他方法的性能。这一结果表明,该模型在处理复杂多变量时空数据时具有较高的灵活性和有效性。同时,模型的结构设计使其能够更好地适应不同场景下的预测需求,从而为海洋热浪的长期预测提供了新的思路和技术手段。

综上所述,海洋热浪的预测是一项复杂而重要的任务,涉及多变量、多尺度和时空依赖性的建模。传统的物理模型和数据驱动方法各有优劣,而基于图神经网络的MMS-GNN模型则在捕捉复杂时空关系方面展现出显著优势。通过结合Transformer和GNN,该模型能够更全面地学习多变量时间序列数据中的时空相关性和依赖性,从而提升预测的准确性和可靠性。未来的研究可以进一步探索该模型在其他海洋区域的应用潜力,以及如何优化其结构以适应更广泛的数据集和预测需求。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号