一种基于数据的框架,用于评估环境因素对富营养化湖泊中浮游植物生物量的影响

《Ecological Indicators》:A data-driven framework for assessing the impact of environmental factors on phytoplankton biomass in a eutrophic lake

【字体: 时间:2025年07月15日 来源:Ecological Indicators 7.0

编辑推荐:

  本研究开发了一种结合LightGBM特征选择与GAM非线性建模的混合框架,用于预测太湖蓝藻生物量。基于2009-2018年五个监测站点的数据,模型在时空异质性显著的环境中表现出优于传统GAM的预测性能,R2adj达0.36-0.56,揭示了营养盐与气象因素的复杂交互作用,为差异化管理提供依据。

  在淡水生态系统中,水体富营养化现象日益严重,给水资源管理和生态系统的稳定性带来了巨大挑战。以中国太湖为例,其作为长江三角洲地区的重要水源地,由于水体交换受限、营养物质排放量高以及气候变暖等因素,长期面临严重的富营养化问题和频繁的有害藻类水华。为应对这一挑战,研究人员提出了一种结合机器学习与生态学解释能力的混合模型框架,即LightGBM-GAM模型,以提高对太湖藻类生物量(PB)的预测精度和对生态机制的理解。

LightGBM是一种基于梯度提升决策树(GBDT)的高效机器学习算法,由微软开发。它通过叶子优先的树结构和深度限制策略,能够快速处理大规模数据集,同时有效识别关键环境变量。GAM(广义可加模型)则是一种非参数扩展的广义线性模型,能够捕捉环境变量与PB之间的非线性关系,而不依赖于特定的假设。本研究将LightGBM与GAM相结合,形成了一种新的预测框架,以期在太湖不同区域提供更准确的PB预测,并揭示其与环境因素的复杂关系。

研究采用2009年至2018年间太湖五个监测站点的月度数据,分析了PB与水文和气象因素之间的关系。结果表明,该混合模型在预测性能上优于传统的多变量GAM模型。LightGBM-GAM模型在不同站点的调整R2值范围为0.36至0.56,解释了PB变异性的41.8%至64.2%。此外,该模型的AIC值较低,能够更准确地捕捉极端水华事件。通过LightGBM的特征重要性分析,研究发现水体中的化学需氧量(COD)、总磷(TP)和总氮(TN)是影响PB的主要水文参数,而气象因素如气温(AT)、气压(PRES)、太阳辐射(SR)、风速(MWV)和风向(MWD)也具有显著影响。这些变量共同贡献了超过85%的累积特征重要性,说明它们在PB形成过程中起着决定性作用。

进一步分析表明,不同站点的PB响应模式存在显著差异。例如,在北岸的梅梁湾(Station 4)和西部区域(Station 10),PB表现出较高的值,而在湖泊中心区域(Station 14)则相对较低。这种空间差异可能与不同区域的水动力条件、营养物质积累以及水体稳定性等因素有关。此外,研究还发现,PB对某些环境变量的响应并非线性,而是呈现非线性或阈值效应。例如,在部分站点,随着TP和TN浓度的增加,PB会先上升后趋于稳定,甚至出现下降趋势,表明这些营养物质在一定条件下对PB的促进作用存在极限。

在模型构建过程中,研究人员首先利用LightGBM进行特征选择,识别出对PB影响最大的环境变量。随后,通过GAM对这些变量进行非线性建模,从而揭示其与PB之间的复杂关系。这种两阶段的方法不仅提高了模型的预测能力,还增强了对生态机制的理解。例如,GAM的平滑响应曲线显示了PB与COD、TP、TN、DO、AT、SR等变量之间的非线性关系,揭示了不同区域中这些变量对PB的具体影响方式。此外,模型还能够有效区分不同区域的PB变化趋势,为针对性的管理措施提供科学依据。

研究结果表明,传统的多变量GAM模型在处理高维数据时存在局限性,尤其是在变量选择方面需要大量人工干预,容易引入偏差或忽略关键因素。而LightGBM-GAM混合模型通过自动化特征选择和非线性建模,显著提高了预测的准确性和效率。这种模型不仅适用于太湖,还具备推广到其他富营养化水体的潜力,特别是在需要快速、空间化预测PB的场景中。此外,研究还指出,模型的预测能力在一定程度上依赖于数据的完整性和质量,未来研究可以考虑引入更高频率的数据和更广泛的环境变量,以进一步提升模型的预测性能。

在管理层面,本研究的结果为太湖的水华防控提供了重要的科学依据。例如,在富营养化严重的区域,如竺山湾(Station 1)和梅梁湾(Station 4),应重点控制农业径流和城市污水排放,减少TP和TN的输入。而在湖泊中心区域,由于风速(MWV)对水体稳定性的影响较大,可以通过人工调控水流或优化水动力条件来减少水华的发生。同时,模型的预测能力也为制定动态管理策略提供了支持,能够根据实时监测数据预测PB的变化趋势,从而指导预防和应对措施。

综上所述,LightGBM-GAM混合模型为富营养化湖泊中PB的预测提供了一种高效且具有生态解释力的方法。通过结合LightGBM的特征选择能力和GAM的非线性建模优势,该模型不仅能够更准确地预测PB的变化,还能够揭示其与环境因素之间的复杂关系,为水华防控和水资源管理提供了科学支持。然而,研究也指出,当前模型仍存在一定的局限性,如未考虑生物因素(如浮游动物摄食)对PB的影响,以及数据的时间跨度可能限制对长期趋势的分析。因此,未来的研究应进一步整合生物相互作用因素,并延长数据的时间范围,以更全面地理解PB的动态变化,从而提升模型的实用性和预测精度。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号