基于机器学习与偏差校正气候情景的北比斯坎湾有害藻华预测研究
《Journal of Hydrology X》:Projecting harmful algal blooms in North Biscayne Bay using machine learning and bias-corrected climate scenarios
【字体:
大
中
小
】
时间:2025年10月27日
来源:Journal of Hydrology X 3.1
编辑推荐:
本研究针对北比斯坎湾有害藻华(HABs)预测难题,创新性地结合支持向量机(SVM)模型与经偏差校正的CMIP6气候情景(SSP126/245/585),首次实现非自回归特征的长期叶绿素a浓度预测。研究发现降水、上游径流和最低气温是藻华的正向驱动因子,风速呈负相关,SSP126情景下叶绿素a年增长率最高(0.0045?μg/L),湿季浓度显著高于干季。该研究为海岸带水质量管理提供了可解释的机器学习框架和气候适应性决策工具。
在风景如画的北比斯坎湾,一片位于迈阿密-戴德县城市化区域下游的生态热点,有害藻华(Harmful Algal Blooms, HABs)的频繁暴发正悄然侵蚀着这片水域的健康。藻华不仅会释放毒素,其大规模增殖更会对水生生态系统、地方经济和公共健康造成深远的不利影响。随着全球气温升高和降雨模式改变,适宜藻华形成的条件预计将进一步恶化。然而,传统预测方法如过程模型和统计模型,往往难以捕捉复杂的环境相互作用,或存在过度简化的问题,尤其在长期气候变化的背景下,其预测能力更显不足。更关键的是,许多先进的机器学习预测模型依赖目标变量(如历史叶绿素a浓度)的自回归特征,这限制了它们在缺乏未来目标值情况下的长期预测能力。为了应对这一挑战,并为海湾的有效水质管理提供科学依据,研究人员开展了一项创新性的研究。
为了填补上述空白,这项发表在《Journal of Hydrology X》上的研究,由Zhengxiao Yan和Nasrin Alamdari合作,旨在开发一种不依赖自回归特征、结合偏差校正气候情景的机器学习框架,以预测北比斯坎湾未来至2100年的有害藻华动态。研究核心围绕三个关键问题展开:能否仅使用环境变量(排除自回归输入)预测城市海岸环境中的有害藻华?哪些气候和水文驱动因子对气候变化下的长期藻华趋势最重要?未来气候情景和季节条件将如何影响北比斯坎湾有害藻华的频率和强度?
为达成研究目标,研究人员整合了多源数据并应用了多项关键技术。他们收集了北比斯坎湾BB02站点1998-2020年的历史水质数据(如叶绿素a、氨氮、溶解氧等)和气候数据,并引入了12个月的滞后特征以捕捉时间模式。针对未来预测,研究采用了来自NEX-GDDP-CMIP6数据集的四个全球气候模型(BCC-CSM2-MR, CNRM-ESM2-1, MPI-ESM1-2-LR, MRI-ESM2-0)在三种共享社会经济路径(SSP126, SSP245, SSP585)下的投影。关键方法包括:1) 使用分位数映射对原始气候模型输出进行偏差校正,使其统计特性与当地观测记录一致;2) 开发并比较了三种机器学习回归模型——支持向量机、随机森林和多层感知器,通过网格搜索进行超参数调优,并利用SHAP值增强模型可解释性;3) 采用迪博尔德-马里亚诺检验评估模型预测性能的显著性差异;4) 基于偏差校正后的未来气候数据,驱动最优机器学习模型预测2021-2100年的叶绿素a浓度。值得注意的是,由于缺乏公开的高分辨率未来水质预测,研究假设2001-2020年观测到的水质变量季节性分布将持续至2100,这为分离气候驱动因素的影响提供了一个保守基线。未来径流和水温则通过多元线性回归模型基于偏差校正后的气候变量进行估算。
模型评估表明,支持向量机模型在预测叶绿素a浓度方面表现最佳,训练集R2为0.82,测试集R2为0.74,均方误差和平均绝对百分比误差均低于随机森林和多层感知器模型。迪博尔德-马里亚诺检验结果支持选择支持向量机作为主要预测模型。SHAP分析揭示了影响预测的关键环境变量:滞后1个月的降水、滞后1个月的上游径流和当月最低气温对叶绿素a浓度有正向影响,而当月风速则呈现负相关。
通过分位数映射进行偏差校正后,统计检验(Levene检验、Kolmogorov-Smirnov检验、Mann-Whitney U检验)的高P值表明,校正后的模拟历史数据与观测数据在方差、分布和中位数上均无显著差异,验证了偏差校正的有效性。校正后的未来气候数据显示,最低气温、气温和比湿呈上升趋势,风速呈下降趋势,而降水在历史数据中增加但在未来情景下(尤其是SSP585)呈现下降趋势。
未来叶绿素a浓度在所有情景下均呈现稳步上升趋势。SSP126情景下的年增长率最大(0.0045 μg/L/年),高于SSP245(0.0007 μg/L/年)和SSP585(0.0005 μg/L/年)。SSP126情景也预测了最频繁的极端叶绿素a事件(36-82次超标),其次是SSP245(32-65次)和SSP585(24-54次)。季节性分析表明,湿季(6-10月)的叶绿素a浓度始终高于干季(11-5月),且长期(2071-2100)增长幅度大于短期(2021-2050)。
本研究成功构建了一个结合偏差校正气候投影与可解释机器学习(支持向量机)的框架,用于预测北比斯坎湾未来的有害藻华。研究发现,水文变量(降水和径流)和气象变量(最低气温、风速)是藻华的关键驱动因子。令人略感意外的是,在最温和的气候情景SSP126下,叶绿素a的增长率反而最高,这可能与SSP585情景下降水减少抑制了营养盐输送有关,凸显了气候变化与藻华之间复杂的非线性关系。湿季藻华风险更高且长期持续上升的预测,强调了针对湿季采取重点监测和预警策略的必要性。
该研究的创新之处在于其非自回归的建模方法,使其能够进行长期的、纯气候驱动的预测,这是许多依赖自回归特征的短期预测模型所无法实现的。同时,通过SHAP分析提供的模型可解释性,增强了结果的可信度和实际指导意义。尽管研究存在一些局限性,如假设水质驱动因子静止不变、未考虑生物相互作用和盐度动态等,但其提供的预测框架和见解对于海岸带管理者和决策者应对气候变化下的藻华威胁具有重要价值。这项研究为开发预测性工具、优先安排湿季监测和制定早期预警策略提供了科学依据,有助于保护城市河口地区的生态系统和公共健康。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号