编辑推荐:
针对 SWH 数据驱动预测中缺失值影响精度、需有效多元时间序列建模的问题,研究人员开展基于条件分数扩散模型(CSDI)的多元时间序列连续建模与时间插补研究,结果表明 CSDI 提升插补效果与 SWH 预测精度,具重要应用价值。
在海洋与海岸工程等领域,准确预测有效波高(SWH,定义为给定时间段内固定点观测到的最高三分之一海浪的平均值)至关重要。然而,海洋环境复杂多变,海浪具有非线性、不规则性和随机性等特点,传统基于物理的数值模型,如波浪建模(WAM)、WAVEWATCH III、近岸波浪模拟(SWAN)等,虽能在不同海洋环境中计算波浪,但计算量大、耗时长,难以满足实际需求。随着海洋监测技术和大数据科学的发展,数据驱动预测方法逐渐兴起,机器学习(ML)模型如支持向量机(SVM)、多层感知机(MLP)、循环神经网络(RNN)、长短期记忆网络(LSTM)、时间卷积网络(TCN)等被广泛应用于 SWH 预测。但这些方法面临两大关键挑战:一是浮标常因风暴或事故损坏导致数据缺失,影响模型精度并增加过拟合风险;二是与海浪形成和演化相关的气象数据(如风速、风向、大气压力、海面温度等)海量,传统模型难以有效纳入。为解决这些问题,海南大学、国家海洋信息中心等机构的研究人员开展了相关研究,成果发表在《Dynamics of Atmospheres and Oceans》。该研究提出一种基于条件去噪扩散模型(CSDI)的新方法,旨在通过数据插补提高 SWH 预测精度,在统一框架内解决多元时间序列插补和波高预测问题。
研究主要采用的关键技术方法包括:利用美国国家数据浮标中心(NDBC)的浮标数据(包含 SWH、风速、波向等气象数据),运用条件分数扩散模型(CSDI)进行多元时间序列的连续时间建模和时间插补,在噪声估计网络中引入两个注意力层以捕捉特征间关系和时间依赖,并实施概率预测方法描述波浪不确定性。
案例研究
研究人员在两个不同的 NDBC 浮标数据集上,利用 CSDI 开展插补和预测任务。首先对 NDBC 浮标数据中的缺失值进行填充,将该方法与经典和当前最先进的方法进行比较,运用多种评估指标评估插补效果。随后,基于插补后的数据进行有效波高预测。
结论和展望
由于数据记录和传输问题,NDBC 数据集存在大量缺失值,给数据驱动的波浪预测带来挑战。本研究引入基于条件去噪扩散模型的 SWH 预测新方法,对多元时间序列进行连续时间建模和时间插补。研究表明,CSDI 在捕捉时间相关性和改善 SWH 短期预测方面具有优势,在常用性能指标上,其插补效果比现有插补方法提高 7%-30%,且多元数据的 SWH 预测结果优于单变量数据,证实了时间数据插补对预测的益处。该研究为 SWH 预测提供了新的有效途径,有助于提升海洋灾害管理能力,为相关领域的研究和应用提供了重要参考,未来可进一步探索该方法在更复杂海洋环境和更长时间序列预测中的应用。