基于机器学习的预测方法,利用卫星数据对北印度洋地区的叶绿素-a含量进行预测和预报

《Ecological Informatics》:Machine learning-based prediction and forecasting of chlorophyll-a in the northern Indian Ocean using satellite data

【字体: 时间:2025年10月22日 来源:Ecological Informatics 7.3

编辑推荐:

  准确预测和预报海洋叶绿素-a(Chl-a)浓度对可持续海洋管理至关重要。本研究采用XGBoost、LSTM、随机森林(RF)、支持向量回归(SVR)和多层感知机(MLP)五种机器学习模型,基于1998-2022年卫星数据,整合海表温度(SST)、海表高度(SSH)和混合层深度(MLD)等环境变量,评估其在北印度洋(NIO)Chl-a预测中的性能。结果显示,XGBoost表现最优,测试集R2为0.830,RMSE为0.056,且能捕捉环境变量间的非线性关系;LSTM次优,但存在过拟合风险。预测表明NIO初级生产力呈下降趋势,可能与升温、海洋分层加剧及营养盐减少相关。SHAP分析揭示SSH和MLD对Chl-a影响最大,其次是滞后Chl-a值。该研究验证了机器学习在动态海洋生态系统中的预测能力,为气候变化评估和渔业管理提供工具支持。

  在海洋生态系统可持续管理中,准确预测和预报叶绿素-a(Chl-a)浓度具有重要意义。Chl-a作为浮游植物的生物标志物,其浓度变化能够反映海洋初级生产力的动态,进而影响整个海洋食物网和生物地球化学循环。然而,尽管已有大量研究致力于分析历史Chl-a数据,但针对开发高效、稳定的预测模型的工作仍相对有限。本文通过引入机器学习(ML)技术,利用1998年至2022年的卫星遥感时间序列数据,对北印度洋(NIO)区域的Chl-a浓度进行了预测与预报,旨在填补这一研究空白。

北印度洋是全球生物生产力较高的区域之一,其生态系统受到多种环境因素的共同影响,包括海表温度(SST)、海表高度(SSH)和混合层深度(MLD)。这些变量与Chl-a浓度之间存在显著的非线性关系,且在空间和时间上表现出高度的异质性。此外,NIO地区的气候变化尤为显著,近年来极端天气事件的频率和强度均有明显增加,这进一步影响了其生物地球化学特性,包括Chl-a的波动。因此,传统的基于物理过程的模型在捕捉这种复杂的非线性动态方面存在局限,迫切需要更先进的、数据驱动的预测方法。

在本研究中,研究人员采用五种机器学习模型,包括XGBoost、长短期记忆网络(LSTM)、随机森林(RF)、多层感知机(MLP)和支持向量回归(SVR),对NIO区域的Chl-a浓度进行了评估和预测。其中,XGBoost模型表现最为突出,其训练集和测试集的R2值分别为0.892和0.830,RMSE分别为0.048和0.056,MAPE分别为0.069和0.078。相比之下,LSTM、RF和MLP模型的表现相对较好,但均不如XGBoost。而SVR模型由于在捕捉数据复杂性方面存在不足,表现相对较弱。这些结果表明,XGBoost在处理非线性、多维数据方面具有显著优势,尤其适用于基于卫星数据的海洋环境预测。

模型评估采用了多种统计指标,包括均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)以及决定系数(R2),以全面衡量模型的预测能力。这些指标不仅反映了模型的准确性,还揭示了其在不同环境条件下的泛化能力。通过残差分析,研究人员发现XGBoost在预测中等生产力时期的Chl-a浓度时表现出极高的稳定性,而在极端生产力事件中存在一定的低估现象。这表明,尽管XGBoost在整体上表现优异,但仍需进一步优化以提高对极端事件的预测能力。

特征重要性分析揭示了影响Chl-a浓度变化的关键环境变量。其中,海表高度(SSH)和混合层深度(MLD)在模型中占据重要地位,分别贡献了18.9%和10.5%的预测作用,而海表温度(SST)也发挥了显著影响,贡献了10.2%。此外,滞后1个月和滞后11个月的Chl-a浓度对预测结果也具有重要影响,分别占17.4%和10.6%。这些发现强调了海洋物理和生物过程在调控NIO地区初级生产力中的关键作用。通过SHAP(SHapley Additive exPlanations)方法,研究人员能够更直观地解释模型预测的机制,从而增强其可解释性。这种解释性对于理解海洋生态系统的动态变化至关重要,也为后续的模型优化和应用提供了依据。

研究结果还揭示了NIO地区初级生产力的潜在变化趋势。根据预测,2023年至2027年的Chl-a平均浓度为0.538 mg/m3,略低于历史平均值0.543 mg/m3,且极端高生产力事件的浓度峰值低于历史最高值1.158 mg/m3。这表明,尽管NIO地区的整体生产力可能保持相对稳定,但环境变化可能加剧其季节性波动。这种变化趋势对渔业资源管理、生态系统保护以及气候变化研究具有重要影响。例如,浮游植物的减少可能会影响鱼类的生长和繁殖,进而影响渔业产量。同时,浮游植物在碳循环和海洋生态系统中扮演着重要角色,其变化可能对全球气候调节产生深远影响。

此外,本研究还指出,传统的基于物理过程的模型在处理NIO地区的复杂非线性关系时存在不足,而机器学习方法能够更有效地捕捉这些关系。XGBoost的优异表现不仅在于其高精度,还在于其能够处理多维数据和非线性模式的能力。相比之下,其他模型如LSTM在捕捉时间序列中的季节性和周期性方面表现良好,但在处理复杂的非线性关系时存在一定的局限性。而RF、SVR和MLP模型则在泛化能力和稳定性方面表现出不足,尤其是在面对极端环境条件时。

为了进一步提升预测模型的可靠性,研究建议未来应结合多种机器学习方法,开发混合模型以增强预测的鲁棒性。此外,整合更多的环境变量,如风场、营养盐浓度、盐度和海洋环流等,也有助于提高模型的准确性和生态相关性。同时,通过引入不确定性分析,可以更全面地评估模型的预测能力,并为实际应用提供更可靠的决策支持。

综上所述,本研究通过机器学习方法对NIO地区的Chl-a浓度进行了有效预测,揭示了该地区初级生产力的变化趋势,并强调了XGBoost在处理复杂非线性关系方面的优势。这些发现不仅为海洋生态系统的可持续管理提供了科学依据,也为未来研究提供了新的方向,特别是在结合多源数据、提升模型解释性以及应对气候变化带来的挑战方面。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号