在分层化的北极湖泊中连接下层水(Hypolimnion)与上层水(Epilimnion):基于机器学习的方法,利用上层水的水质数据估算下层水的水质

《Water Research》:Linking Hypolimnion to Epilimnion in a Stratified Arctic Lake: Machine Learning-Based Estimation of Hypolimnetic Water Quality from Epilimnetic Measurements

【字体: 时间:2026年01月13日 来源:Water Research 12.4

编辑推荐:

  北极湖泊深层水质预测模型研究

  
梅赫兰·马赫迪安(Mehran Mahdian)|鲁霍拉·努里(Roohollah Noori)|穆罕默德·贾瓦德·萨拉瓦尼(Mohammad Javad Saravani)|阿里·雷扎·沙赫瓦兰(Ali Reza Shahvaran)|莫赫森·沙赫莫罕默德(Mohsen Shahmohammad)|保罗·P.J. 加夫尼(Paul P.J. Gaffney)|穆罕默德·米拉德·萨拉马塔拉布(Mohammad Milad Salamattalab)|米拉德·沙姆西·安布希(Milad Shamsi Anboohi)|马吉德·侯赛因扎德(Majid Hosseinzadeh)|范夏(Fan Xia)|周永强(Yongqiang Zhou)|张云林(Yunlin Zhang)|米科·科莱赫迈宁(Mikko Kolehmainen)|索鲁什·阿博尔法蒂(Soroush Abolfathi)
芬兰东芬兰大学环境与生物科学系,库奥皮奥(Kuopio,芬兰)

摘要

了解分层湖泊深层的水质至关重要,因为这些区域决定了生态系统的稳定性和生物多样性的健康状况。分层湖泊的最底层(称为“湖底层”或“hypolimnion”)通过限制垂直水流和促进污染物积累起着关键作用,因此可以作为长期湖泊状况的指标。虽然现在可以使用原位传感器和卫星观测来常规监测表层水质,但评估湖底层状况仍然成本高昂且具有物流挑战性,尤其是在环境条件恶劣和物流受限的北极地区。本研究利用1979年至2022年间在单一监测站收集的长期数据集(该站点同时测量了表层和湖底层的数据),开发并比较了五种机器学习和深度学习模型(包括人工神经网络(ANN)、随机森林(RF)、极端梯度提升(XGBoost)、支持向量回归(SVR)和Kolmogorov–Arnold网络(KAN),以根据容易获得的表层水质预测指标来估算芬兰伊纳里湖(Lake Inari)的湖底层总氮(TN)、总磷(TP)和溶解氧(DO)含量。模型性能通过五折交叉验证进行评估,并使用Nash–Sutcliffe效率(NSE)、标准化平均绝对误差(NMAE)和决定系数(R2)进行评价。对于总氮(TN),随机森林模型表现最佳,其五折交叉验证的NSE值为0.52,NMAE值为0.11,R2值为0.52,优于其他模型的NSE值(0.38–0.52)、NMAE值(0.12–0.14)和R2值(0.47–0.51)。对于总磷(TP),人工神经网络模型的预测能力更强(NSE值为0.49,NMAE值为0.13,R2值为0.55),而其他模型的NSE值介于0.17–0.46之间,NMAE值介于0.13–0.18之间,R2值介于0.32–0.51之间。对于溶解氧(DO),随机森林模型始终优于其他方法,其NSE值为0.76,NMAE值为0.09,R2值为0.77,而其他模型的NSE值介于0.62–0.72之间,NMAE值介于0.10–0.11之间,R2值介于0.68–0.73之间。总体而言,所有五种模型在溶解氧预测方面都表现出最强性能。排列重要性分析表明,表层总氮(TN)、总磷(TP)和水温是预测湖底层相应指标的关键因素。本研究展示了一种实用、近乎实时且成本效益高的方法,可用于评估分层北极湖泊的深层水质,为在日益增长的气候压力下改进监测和管理提供了新的机会。

引言

湖泊、湿地和河流仅覆盖了地球表面的一小部分(Downing等人,2006年),但它们对全球生物多样性、水资源供应和碳循环至关重要。这些淡水系统提供了重要的生态系统服务,从维持渔业到调节区域气候,因此保护它们对于环境稳定至关重要。然而,这些系统的生态完整性正日益受到人为压力(包括工业化、城市化、森林砍伐和农业集约化)以及气候变化加速影响的威胁(Mahdian等人,2023年)。气温上升和降水模式改变加剧了富营养化和污染物积累,从而降低了全球水质(Asresu等人,2025年)。虽然表层水质可以常规监测,但这些生态系统深层的变化仍研究不足,特别是在经历快速气候变化的地区。
北极地区受气候变化的影响最为严重,其变暖速度是全球平均水平的两倍多(Jansen等人,2024年)。冰层覆盖时间的缩短延长了开阔水域的季节,并改变了水温分层(Woolway等人,2021年)。提前结冰和延迟结冰导致夏季分层加剧和湖底层氧气耗尽加深(Jansen等人,2025年;Klanten等人,2023年)。一些深湖由于冬季氧气循环改善而受益,但较小和较浅的湖泊则相反;温暖的冬季减少了垂直混合,加剧了冰下缺氧(Elser和Klip,2025年;Smits等人,2021年)。同时,永久冻土的融化正在根本改变北极湖泊的化学成分。随着冻结土壤的退化,大量有机物、营养物质和污染物释放到相邻水体中(Vonk等人,2015年)。这导致湖泊颜色普遍变化,溶解有机碳增加,浊度升高,营养物质负荷增加,偶尔还会出现铁、硫酸盐和汞等污染物的峰值(Kuhn和Butman,2021年;Wauthy等人,2018年)。最近对阿拉斯加北部75条溪流的观测显示,融化的土壤中的铁被释放到溪流中并氧化,导致颜色突然变化和酸化,类似于酸性矿山排水(Bulínová等人,2025年;O’Donnell等人,2024年)。这些变化不仅提高了藻类生产力,还加剧了底部水体的微生物分解和氧气需求。此外,北极湖泊中栖息着适应寒冷环境的特化微生物群落,它们参与碳和营养物质的循环;变暖和有机物质输入的增加可能使这些群落向更厌氧、产生甲烷的代谢方式转变,进一步加剧了水质挑战。总体而言,冰层变化和永久冻土融化正在加速北极湖泊的化学和生态变化,将这些敏感系统推向变化的临界点。
这些独特的水文和生物地球化学变化突显了湖底层(分层湖泊中寒冷、密集且通常缺氧的环境)作为理解生态系统恢复力的关键焦点的重要性。这一区域对混合模式的变化和营养物质及污染物的积累非常敏感(Adrian等人,2009年)。然而,有限的垂直混合和低溶解氧(DO)促进了营养物质和污染物的积累,使得这一层成为长期生态系统健康状况的敏感指标。因此,持续监测湖底层水质对于保护生物多样性、为管理提供信息以及追踪快速变化的北极环境的影响至关重要。尽管如此,监测湖底层仍然存在物流挑战和成本问题。采样深层水体需要专用设备和实验室分析,而北极地区的条件进一步限制了可访问性和时间覆盖范围。尽管遥感方法对于表层监测非常宝贵,但它们仅限于光学可访问的层次,无法直接捕捉地下动态(Gholizadeh等人,2016年;Shahvaran等人,2024年)。
人工智能(AI)的最新进展,特别是机器学习(ML)和深度学习(DL),为克服这些监测挑战提供了新的可能性(Khosravi等人,2025年;Kim等人,2024a;Zhi等人,2024年),尽管当前的应用主要限于温带地区。例如,一些研究成功使用了梯度提升和长短期记忆框架来预测底层水的溶解氧和分层变化(Leach等人,2018年;Lin等人,2024年;Zhu等人,2025年)。然而,这些研究主要集中在分层相对稳定的温带或亚热带系统。相比之下,北极湖泊的分层周期较短,冰层覆盖效应明显,对变暖的敏感性更高,这从根本上改变了表层与湖底层之间的耦合(Persaud等人,2025年)。此外,尽管过程导向的框架已在数据稀少的温带地区预测了温度(例如,Read等人,2019年),但它们在快速变化的北极热环境中的适用性尚未得到系统评估。这凸显了一个明确的研究空白:需要测试先进的ML/DL架构是否能够仅使用容易获得的表层数据来捕捉北极湖泊独特的非线性地下水质动态。
在这里,我们提出了第一个基于AI的框架,旨在根据分层北极湖泊中容易测量的表层变量来估算湖底层水质参数,包括总氮(TN)、总磷(TP)和溶解氧(DO)。该框架以芬兰伊纳里湖为例,该湖提供了用于测试AI驱动预测方法的独特长期数据集。数据集涵盖1979年至2022年期间关键水质指标的全面表层和底层测量数据:TN、TP、DO、化学需氧量(COD)、水色(COL)、电导率(CN)、pH值、水温(WT)和浊度。利用这一独特数据集,我们开发并比较了五种先进的ML和DL方法,包括Kolmogorov-Arnold网络(KAN)、人工神经网络(ANN)、XGBoost、随机森林(RF)和支持向量回归(SVR)。这些模型特别适用于从稀疏、异构数据中提取稳健的非线性关系,使它们能够适应严酷北极环境中的非平稳性和有限采样。基于这一框架,我们的研究追求三个具体目标:(i)评估是否可以从常规监测的表层变量可靠地推断出湖底层的TN、TP和DO;(ii)识别并量化对深层水化学起最强控制作用的特定表层因素;(iii)建立一个可扩展、成本效益高的近实时评估框架,以减少深层水监测的物流负担。这种方法弥合了关键的空间和时间数据差距,支持基于证据的管理,并推进北极和其他数据受限地区的预测研究。

研究区域

研究区域

伊纳里湖位于芬兰北部,属于北极地区,纬度范围为68° 41′至69° 21′ N,经度范围为27° 01′至28° 40′ E(图1)。其平均表面积约为1,106平方公里,最大深度为90米,体积约为15.9立方公里,海拔高度为117米(高级陆地观测卫星全球数字表面模型(AW3D30);日本宇宙航空研究开发机构,2021年)。伊纳里湖主要由Juutuanjoki河和Ivalojoki河补给

数据分析

根据美国环境保护署(U.S. EPA)的分类标准(Gibson等人,2000年),伊纳里湖表层和湖底层的总磷(TP)和总氮(TN)浓度属于贫营养型( TP <10 μg L?1 和 TN <350 μg L?1),表明其生物生产力较低,这是北极湖泊的典型特征。极低的TP浓度可能表明磷限制了藻类生长,有效防止了伊纳里湖的富营养化。溶解氧(DO)浓度

模型在预测湖底层TN、TP和DO方面的表现

在这项研究中,开发了五种数据驱动模型(即ANN、SVR、XGBoost、RF和KAN),利用有限的表层水质测量数据来预测伊纳里湖(最大的北极淡水系统之一)的湖底层TN、TP和DO浓度。这些模型有效捕捉了在强烈物理和生物地球化学耦合作用下的湖底层非线性变化。模型性能通过五折交叉验证的NSE、NMAER2进行评估

结论

在这项研究中,我们引入了一种基于AI的新框架,使用有限的表层测量数据来预测北极湖泊的关键湖底层水质参数,即TN、TP和DO。这种方法解决了在偏远、恶劣环境中进行深层水采样的物流和财务挑战,其中数据稀缺是一个主要障碍。以芬兰第三大湖泊伊纳里湖为例,我们利用了1979年至2022年的独特数据集

作者贡献

概念构思:梅赫兰·马赫迪安(M. Mahdian)和鲁霍拉·努里(R. Noori);方法论:梅赫兰·马赫迪安(M. Mahdian)和鲁霍拉·努里(R. Noori);软件:梅赫兰·马赫迪安(M. Mahdian)、鲁霍拉·努里(R. Noori)、穆罕默德·贾瓦德·萨拉瓦尼(M.J. Saravani)、阿里·雷扎·沙赫瓦兰(A.R. Shahvaran)和穆罕默德·米拉德·萨拉马塔拉布(M.M. Salamattalab);验证:梅赫兰·马赫迪安(M. Mahdian)、鲁霍拉·努里(R. Noori)、莫赫森·沙赫莫罕默德(Mohsen Shahmohammad)、马吉德·侯赛因扎德(M. Hosseinzadeh)、米科·科莱赫迈宁(M. Kolehmainen)和索鲁什·阿博尔法蒂(S. Abolfathi);数据采集:梅赫兰·马赫迪安(M. Mahdian)、鲁霍拉·努里(R. Noori)和穆罕默德·沙姆西·安布希(M. Shamsi Anboohi);形式分析:梅赫兰·马赫迪安(M. Mahdian)、鲁霍拉·努里(R. Noori)、穆罕默德·沙赫莫罕默德(M. Shahmohammad)和保罗·P.J. 加夫尼(P.P.J. Gaffney);调查:梅赫兰·马赫迪安(M. Mahdian)、鲁霍拉·努里(R. Noori)、范夏(F. Xia)、周永强(Y. Zhou)和张云林(Y. Zhang);可视化:梅赫兰·马赫迪安(M. Mahdian)、R.

数据可用性声明

本研究使用的数据可在以下网址公开获取:htpps://ww wp2.ymparisto.fi/scripts/kirjaudu.asp。

未引用的参考文献

张等人,2024年;左等人,2023年;康等人,2024年;库埃等人,2025年;拉布里和马兰格等人,2024年;内贾德等人,2024年;奥鲁克等人,2025年;夏尔马等人,2024年

CRediT作者贡献声明

梅赫兰·马赫迪安(Mehran Mahdian):撰写——初稿、可视化、验证、软件、方法论、调查、形式分析、数据管理、概念构思。鲁霍拉·努里(Roohollah Noori):撰写——审阅与编辑、可视化、验证、监督、软件、方法论、调查、形式分析、数据管理、概念构思。穆罕默德·贾瓦德·萨拉瓦尼(Mohammad Javad Saravani):撰写——初稿、可视化、软件。阿里·雷扎·沙赫瓦兰(Ali Reza Shahvaran):撰写——初稿、可视化

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

我们感谢中国科学院的PIFI项目对本研究的财政支持(项目编号:2024VEC0002、2024PG0017和2024DC0005)。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号