编辑推荐:
为解决传统原位采样低频及卫星重访周期长对 Chl-a 反演的限制,研究人员利用 Landsat 4–9 数据结合机器学习模型开展研究。结果表明随机森林模型精度最佳(R2=0.86,RMSE=8.16 μg/L),还开发了开源在线工具,为湖泊水质监测提供新范式。
湖泊作为地球生态系统的重要组成部分,其水质健康直接关系到生物多样性保护与人类社会可持续发展。然而,传统的水质监测手段,如人工船载采样,往往面临空间覆盖不足、时间频次有限的难题,难以捕捉湖泊水质的快速变化与长期趋势。尤其是对于像巴拉顿湖这样面积近 600 km2、具有显著东西向水质梯度的大型湖泊,高频次、全覆盖的监测需求与现有技术手段的局限性矛盾尤为突出。与此同时,卫星遥感技术虽具备大范围观测能力,但 Landsat 卫星约 16 天的重访周期与 “低频次原位采样” 的双重限制,导致叶绿素 - a(Chl-a)反演模型在训练时面临样本不平衡、高浓度事件捕捉不足等挑战。如何整合多源数据、优化模型算法,实现对湖泊 Chl-a 浓度的长期精准监测,成为全球水生态研究领域的重要课题。
为攻克上述难题,匈牙利巴拉顿湖湖沼学研究所(Balaton Limnological Research Institute)的研究团队开展了一项具有开创性的研究。他们以巴拉顿湖为研究对象,利用 Landsat 4–9 卫星的长时序遥感数据,结合原位 Chl-a 测量值,构建了适用于复杂水质环境的 Chl-a 反演框架,并将研究成果发表在《Ecological Informatics》期刊上。该研究不仅揭示了巴拉顿湖近四十年的水质演变规律,更开发了开源的在线监测工具,为全球湖泊水质管理提供了可复制的技术模板。
关键技术方法
研究主要采用以下技术手段:
- 多源数据整合:收集 Landsat 4/5 TM、7 ETM+、8/9 OLI 的 Level 2 地表反射率(SR)数据,通过 Google Earth Engine(GEE)云平台实现数据存储与预处理,确保不同传感器数据的光谱一致性。
- 机器学习建模:训练了随机森林(Random Forest, RF)、多元线性回归(Multiple Linear Regression, MLR)、神经网络(Neural Network, NN)和梯度提升树(Gradient Boosting Tree, GBT)等模型,其中 RF 模型通过引入月份信息(表征藻类物候特征)、扩展时间容差(±3 天)及 SMOTENC 过采样技术,显著提升了对高浓度 Chl-a 样本的拟合能力。
- 模型验证与数据集生成:利用 2369 条原位采样记录(1984–2023 年)构建匹配对,通过 R2、RMSE、MAE 等指标评估模型精度,并基于最优模型生成 30 m 分辨率的长时序 Chl-a 数据集,实现历史数据回溯与实时更新。
研究结果
3.1 样本不平衡问题的解决策略
通过对比不同时间容差(0–3 天)的匹配对构建策略,发现扩展时间容差至 3 天可使匹配对数量从 160 对增至 1299 对,有效捕捉了 Chl-a 浓度范围(0.6–261.7 μg/L)的样本。结合 SMOTENC 过采样技术(将高浓度样本从 119 条扩展至 920 条),RF 模型的 R2 从 0.71 提升至 0.76,RMSE 从 10.5 μg/L 降至 9.5 μg/L,表明过采样技术显著改善了模型对稀有高浓度事件的学习能力。
3.2 模型精度与原位数据一致性
随机森林模型在验证集上表现最优,R2=0.86,RMSE=8.16 μg/L,MAE=4.87 μg/L。长期时序分析显示,模型准确捕捉了巴拉顿湖水质变化趋势:1995 年前因富营养化导致 Chl-a 浓度较高(如站点 I 年均值达 40 μg/L),1995 年 Kis-Balaton 水保护系统建成后,全湖 Chl-a 浓度显著下降(站点 I 降至 15 μg/L),但近年(如 2019、2021 年)因气候变化引发局部藻类爆发,显示水质改善的脆弱性。
3.3 传感器一致性与实时监测工具
结论与讨论
本研究构建的 “长时序卫星数据 + 机器学习 + 云平台” 框架,成功突破了传统监测的时空限制,为大型湖泊水质动态评估提供了高效解决方案。随机森林模型通过整合物候信息与过采样技术,有效克服了样本不平衡难题,其在巴拉顿湖的应用表明,该方法可准确追踪富营养化进程与管理措施成效。此外,开源工具的发布(代码与模型可在 GEE 仓库及 GitHub 获取),降低了其他湖泊应用该技术的门槛,有助于推动全球水生态监测的标准化与协同化。
研究同时指出,尽管模型在整体趋势上表现优异,但对极端高浓度值(>140 μg/L)仍存在低估,未来需通过改进算法(如集成神经网络)与优化大气校正参数(如将 SR 转换为遥感反射率 Rrs)进一步提升精度。随着气候变化加剧湖泊生态系统压力,此类跨学科、跨尺度的研究方法将为水资源管理提供更坚实的科学支撑,助力实现 “绿水青山” 的可持续发展目标。