基于 Landsat 与谷歌地球引擎的长期叶绿素 - a 监测:巴拉顿湖水质研究

【字体: 时间:2025年06月03日 来源:Ecological Informatics 5.9

编辑推荐:

  为解决传统原位采样低频及卫星重访周期长对 Chl-a 反演的限制,研究人员利用 Landsat 4–9 数据结合机器学习模型开展研究。结果表明随机森林模型精度最佳(R2=0.86,RMSE=8.16 μg/L),还开发了开源在线工具,为湖泊水质监测提供新范式。

  湖泊作为地球生态系统的重要组成部分,其水质健康直接关系到生物多样性保护与人类社会可持续发展。然而,传统的水质监测手段,如人工船载采样,往往面临空间覆盖不足、时间频次有限的难题,难以捕捉湖泊水质的快速变化与长期趋势。尤其是对于像巴拉顿湖这样面积近 600 km2、具有显著东西向水质梯度的大型湖泊,高频次、全覆盖的监测需求与现有技术手段的局限性矛盾尤为突出。与此同时,卫星遥感技术虽具备大范围观测能力,但 Landsat 卫星约 16 天的重访周期与 “低频次原位采样” 的双重限制,导致叶绿素 - a(Chl-a)反演模型在训练时面临样本不平衡、高浓度事件捕捉不足等挑战。如何整合多源数据、优化模型算法,实现对湖泊 Chl-a 浓度的长期精准监测,成为全球水生态研究领域的重要课题。
为攻克上述难题,匈牙利巴拉顿湖湖沼学研究所(Balaton Limnological Research Institute)的研究团队开展了一项具有开创性的研究。他们以巴拉顿湖为研究对象,利用 Landsat 4–9 卫星的长时序遥感数据,结合原位 Chl-a 测量值,构建了适用于复杂水质环境的 Chl-a 反演框架,并将研究成果发表在《Ecological Informatics》期刊上。该研究不仅揭示了巴拉顿湖近四十年的水质演变规律,更开发了开源的在线监测工具,为全球湖泊水质管理提供了可复制的技术模板。

关键技术方法


研究主要采用以下技术手段:

  1. 多源数据整合:收集 Landsat 4/5 TM、7 ETM+、8/9 OLI 的 Level 2 地表反射率(SR)数据,通过 Google Earth Engine(GEE)云平台实现数据存储与预处理,确保不同传感器数据的光谱一致性。
  2. 机器学习建模:训练了随机森林(Random Forest, RF)、多元线性回归(Multiple Linear Regression, MLR)、神经网络(Neural Network, NN)和梯度提升树(Gradient Boosting Tree, GBT)等模型,其中 RF 模型通过引入月份信息(表征藻类物候特征)、扩展时间容差(±3 天)及 SMOTENC 过采样技术,显著提升了对高浓度 Chl-a 样本的拟合能力。
  3. 模型验证与数据集生成:利用 2369 条原位采样记录(1984–2023 年)构建匹配对,通过 R2、RMSE、MAE 等指标评估模型精度,并基于最优模型生成 30 m 分辨率的长时序 Chl-a 数据集,实现历史数据回溯与实时更新。

研究结果


3.1 样本不平衡问题的解决策略


通过对比不同时间容差(0–3 天)的匹配对构建策略,发现扩展时间容差至 3 天可使匹配对数量从 160 对增至 1299 对,有效捕捉了 Chl-a 浓度范围(0.6–261.7 μg/L)的样本。结合 SMOTENC 过采样技术(将高浓度样本从 119 条扩展至 920 条),RF 模型的 R2 从 0.71 提升至 0.76,RMSE 从 10.5 μg/L 降至 9.5 μg/L,表明过采样技术显著改善了模型对稀有高浓度事件的学习能力。

3.2 模型精度与原位数据一致性


随机森林模型在验证集上表现最优,R2=0.86,RMSE=8.16 μg/L,MAE=4.87 μg/L。长期时序分析显示,模型准确捕捉了巴拉顿湖水质变化趋势:1995 年前因富营养化导致 Chl-a 浓度较高(如站点 I 年均值达 40 μg/L),1995 年 Kis-Balaton 水保护系统建成后,全湖 Chl-a 浓度显著下降(站点 I 降至 15 μg/L),但近年(如 2019、2021 年)因气候变化引发局部藻类爆发,显示水质改善的脆弱性。

3.3 传感器一致性与实时监测工具


不同 Landsat 传感器(如 L4/5/7 与 L8/9)在 Chl-a 反演结果上具有较高一致性,但 L7 因 SLC-off 故障存在数据缺口。研究团队开发的 GEE 在线应用(https://lihuan.projects.earthengine.app/view/chla-balaton)支持用户交互式查询任意点位的四十年 Chl-a 时间序列,对比不同年代水质差异,并自动更新实时数据,为科研人员与公众提供了直观的监测平台。

结论与讨论


本研究构建的 “长时序卫星数据 + 机器学习 + 云平台” 框架,成功突破了传统监测的时空限制,为大型湖泊水质动态评估提供了高效解决方案。随机森林模型通过整合物候信息与过采样技术,有效克服了样本不平衡难题,其在巴拉顿湖的应用表明,该方法可准确追踪富营养化进程与管理措施成效。此外,开源工具的发布(代码与模型可在 GEE 仓库及 GitHub 获取),降低了其他湖泊应用该技术的门槛,有助于推动全球水生态监测的标准化与协同化。

研究同时指出,尽管模型在整体趋势上表现优异,但对极端高浓度值(>140 μg/L)仍存在低估,未来需通过改进算法(如集成神经网络)与优化大气校正参数(如将 SR 转换为遥感反射率 Rrs)进一步提升精度。随着气候变化加剧湖泊生态系统压力,此类跨学科、跨尺度的研究方法将为水资源管理提供更坚实的科学支撑,助力实现 “绿水青山” 的可持续发展目标。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号