基于随机森林算法的凡伦湖叶绿素a浓度预测与环境驱动因子解析
《Limnology》:Prediction of chlorophyll a concentration and analyzing its relationship with environmental factors in lake V?nern using random forest algorithm
【字体:
大
中
小
】
时间:2025年11月22日
来源:Limnology 1.6
编辑推荐:
本研究针对凡伦湖藻华频发但营养盐限制作用不显著的科学问题,开展了2003-2023年间叶绿素a(Chl a)浓度与光学/气象因子的关联性研究。通过随机森林(RF)和广义线性模型(GLM)揭示了颗粒无机碳(PIC)与水温(SST)是驱动藻类生长的关键因子,RF模型预测精度达R2=0.98。该研究为寡营养湖泊藻华防控提供了新的理论依据。
在全球气候变化和人类活动加剧的背景下,湖泊生态系统正面临着前所未有的压力。作为水生生态系统健康状况的“晴雨表”,叶绿素a(Chlorophyll a, Chl a)浓度直接反映了水体中浮游植物的生物量,是评估水体富营养化和初级生产力的关键指标。然而,在瑞典最大的湖泊——凡伦湖(Lake V?nern)中,出现了一个令人困惑的现象:尽管采取了有效的营养盐减排措施,水体中的总磷和总氮浓度显著下降,但藻类生物量却不降反升。这一反常现象挑战了传统的水生态学认知,即营养盐(尤其是磷)是藻类生长的主要限制因子。凡伦湖作为欧洲第三大湖,不仅是重要的饮用水源和灌溉水源,还承载着渔业、旅游休闲和生态保护等多重功能,其藻华的频繁发生对当地社会经济和生态系统构成了潜在威胁。因此,厘清在寡营养条件下驱动藻类生长的关键环境因子,对于凡伦湖乃至全球类似湖泊的有效管理至关重要。
以往的研究多集中于营养盐丰富的富营养化湖泊,而对凡伦湖这类寡营养湖泊(即水深、营养盐浓度低)中藻华驱动机制的认识仍存在空白。有学者指出,在营养盐匮乏的湖泊中,光照可能取代营养盐成为主要的限制因子,但这一假说在凡伦湖的适用性尚未得到系统验证。随着遥感技术和机器学习算法的飞速发展,为大范围、长时间序列地监测湖泊水色参数并挖掘其与环境因子的复杂非线性关系提供了新的契机。在此背景下,研究人员Sachin Budakoti和Mahendra Pal在《Limnology》上发表了他们的最新研究成果,首次将随机森林(Random Forest, RF)这一强大的机器学习算法应用于凡伦湖叶绿素a浓度的预测与驱动因子解析中。
为了深入探究凡伦湖藻华生长的奥秘,研究人员设计了一套结合遥感技术与机器学习模型的分析框架。他们收集了2003年至2023年共21年的多源数据。核心数据来源于MODIS Aqua卫星,以每月一次、4公里空间分辨率获取了叶绿素a浓度、490nm漫衰减系数(KD490, 表征水体浊度TURB)、归一化荧光线高度(Normalized Fluorescence Line Height, NFLH)、颗粒有机碳(Particulate Organic Carbon, POC)、颗粒无机碳(Particulate Inorganic Carbon, PIC)、光合有效辐射(Photosynthetically Available Radiation, PAR)和海表温度(Sea Surface Temperature, SST)等光学和水色参数。气象数据则整合自GPM任务的降水数据和MERRA-2再分析数据集,包括2米气温(Air Temperature, AT)、风速(Wind Speed, WS)、表面气压(Surface Pressure, SP)、平均海平面气压(Mean Sea Level Pressure, MSLP)以及气溶胶光学厚度(Aerosol Optical Depth, AOD)。研究的关键技术方法主要包括:1) 利用Mann-Kendall趋势检验分析叶绿素a的时空变化趋势;2) 应用随机森林回归模型,以70%的数据作为训练集,30%作为测试集,通过优化超参数(Mtry: 9, Ntree: 1000)来预测叶绿素a浓度,并利用特征重要性排序(%IncMSE和IncNodePurity)和一维/二维偏依赖图(Partial Dependence Plots, PDP)识别关键驱动因子;3) 辅以广义线性模型(Generalized Linear Model, GLM)对RF模型识别出的重要变量进行进一步验证,以确定其统计显著性。
分析显示,2003-2023年间凡伦湖叶绿素a浓度均值超过20 mg m-3,空间上呈现东高西低的分布格局。时间上,叶绿素a浓度整体呈显著上升趋势,尤其在湖泊东部区域,年增长率超过0.3 mg m-3 yr-1。这表明在营养盐浓度较低的背景下,凡伦湖的藻类生物量仍在持续增加。
随机森林模型对叶绿素a浓度的预测表现出极高的准确性,决定系数(R2)高达0.98,均方根误差(Root Mean Square Error, RMSE)低至0.005 mg m-3。预测值与实测值高度吻合,证明了该模型在处理复杂湖泊生态系统数据方面的强大能力。
通过随机森林模型的特征重要性分析,研究人员对影响叶绿素a浓度的12个环境变量进行了排名。无论是基于%IncMSE(置换重要性)还是IncNodePurity(节点纯度重要性),浊度(TURB)都被确定为最重要的驱动因子,紧随其后的是归一化荧光线高度(NFLH)和海表温度(SST)。其余重要因子依次为:2米气温(AT)、光合有效辐射(PAR)、颗粒无机碳(PIC)、降水(PR)和气溶胶光学厚度(AOD)。这一排序清晰地指示了影响凡伦湖藻类生长的主导环境因素。
一维偏依赖图揭示了各主要驱动因子与叶绿素a浓度之间的非线性关系:
- •浊度(TURB)与叶绿素a呈显著正相关,表明水体浑浊度增加会促进藻类生长。
- •归一化荧光线高度(NFLH)与叶绿素a呈显著负相关。
- •海表温度(SST)在约10°C以下时,与叶绿素a呈正相关,超过该阈值后促进作用趋于平稳。
- •颗粒无机碳(PIC)和颗粒有机碳(POC)在较低浓度范围内与叶绿素a正相关,达到一定阈值(PIC约0.010 mol m-3,POC约400 mg m-3)后,影响减弱。
- •光合有效辐射(PAR)在低于20 Einstein m-2 day-1时与叶绿素a负相关(可能由于光抑制效应),超过后影响不显著。
二维偏依赖图进一步揭示了关键因子间的交互作用。例如,高浊度(>4 m-1)与低NFLH(<0.10x10-2 μm-1 sr-1)或高水温(>10°C)相结合时,对叶绿素a浓度的促进作用最为明显。这表明水温对藻类生长的驱动效应在高浊度环境下更为突出。
基于随机森林模型筛选出的重要变量,构建的广义线性模型进一步证实,颗粒无机碳(PIC)和浊度(TURB)与叶绿素a浓度呈极显著正相关,而海表温度(SST)呈显著负相关。该结果与随机森林模型的发现高度一致,共同指向PIC和水温是限制凡伦湖藻类生长的最关键环境驱动因子。
本研究通过综合运用遥感技术和机器学习算法,成功地构建了凡伦湖叶绿素a浓度的高精度预测模型,并深入揭示了在寡营养条件下驱动藻类生长的关键环境因子。研究结论挑战了传统上认为营养盐是藻类生长唯一主要限制因子的观点,指出在凡伦湖这类营养盐浓度已显著降低的湖泊中,颗粒无机碳(PIC)的增加(导致水体pH值升高、酸度降低)和水温(SST)的上升共同构成了促进藻类生物量增长的新机制。
这一发现具有重要的科学意义和管理启示。首先,它解释了为何在磷浓度下降的背景下凡伦湖藻华依然频发,将研究视角从单纯的营养盐控制拓展到了碳循环和气候变暖的相互作用。颗粒无机碳主要来源于碳酸钙(CaCO3),其增加可能与流域内岩石风化、大气沉降或湖泊内部生物地球化学过程有关。水温升高则直接加速藻类代谢速率,延长生长季。两者的协同效应在寡营养湖泊的生态系统响应中可能扮演着比以往认知更为重要的角色。其次,本研究展示了随机森林模型在解析复杂环境系统中非线性关系的强大能力,为湖泊水环境监测与预警提供了一种高效、可靠的技术工具。
然而,研究也存在一定局限性,例如依赖于卫星遥感数据,其精度可能受到大气条件等因素影响。未来的研究可结合地面原位监测数据,进一步优化模型,并深入探究PIC增加的具体来源和转化路径,以及更广泛的气候因子(如热浪、降水格局变化)对湖泊生态系统的影响。
总之,Budakoti和Pal的这项研究不仅为凡伦湖的水质管理提供了具体的科学依据——提示管理者在关注营养盐的同时,需重视碳循环和水温变化对藻华的影响,也为全球寡营养湖泊在面对全球变化时的生态响应研究提供了新的思路和方法论借鉴。随着机器学习与遥感技术的不断融合,我们对复杂生态系统动态的理解和预测能力必将迈上新台阶。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号