
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Landsat遥感数据的美国湖泊水质37年动态监测与机器学习预测模型构建
【字体: 大 中 小 】 时间:2025年07月30日 来源:Scientific Data 5.8
编辑推荐:
本研究通过整合Landsat卫星遥感影像与地面实测数据,构建了覆盖美国本土13,756个湖泊(≥4公顷)1984-2020年的水质预测模型。研究人员利用随机森林算法开发了叶绿素a(CHL)、透明度(Secchi)、真色度(True color)等6项水质参数的遥感反演方法,最高解释方差达63.7%(Secchi)。该数据集包含4590万组反射率数据和74万组地空匹配数据,首次实现了小至4公顷湖泊的长期水质监测,为全球变化下的内陆水体生态研究提供了突破性工具。
在全球气候变化和人类活动加剧的背景下,内陆水体水质恶化已成为严峻的生态挑战。然而,传统水质监测受限于高昂成本和有限覆盖,难以揭示大尺度、长时序的水环境变化规律。尤其对于面积小于10公顷的小型湖泊——这些占全球湖泊总数90%却长期缺乏系统监测的水体,其生态响应机制更是一片空白。
为解决这一难题,密歇根州立大学(Michigan State University)渔业与野生动物系的Patrick J. Hanly团队在《Scientific Data》发表了开创性研究。该团队整合了Landsat 5/7/8卫星37年的遥感数据与水质门户(Water Quality Portal)的地面实测数据,构建了覆盖美国本土136,977个湖泊(≥4公顷)的多参数水质预测体系。研究首次将机器学习模型与遥感技术相结合,突破了小湖泊监测的技术瓶颈,为宏观尺度水生态研究提供了全新范式。
研究采用三大关键技术:1)通过Google Earth Engine平台提取Landsat地表反射率(SR)数据,实施严格的云层和像素质量控制;2)建立包含45.9万组反射率特征和74万组地空匹配数据的训练集;3)开发双阶段随机森林模型(Holdout-data和Full-data),对叶绿素a等6项水质参数进行预测,其中透明度预测的方差解释度最高达63.7%。
【数据与方法】
研究团队创新性地测试了7项工作流程组件,包括确定最佳像素检索范围(全湖尺度优于湖心缓冲区)、波段比值计算方式(像素级优于全湖均值)等。如图5所示,DOC模型的测试表明像素级波段比值可使方差解释度提升15%。
【模型性能】
如表2所示,各水质参数的预测性能差异显著:透明度(Secchi)模型表现最优(R2=0.637),而总悬浮物(TSS)预测精度最低(R2=0.207)。图7-8的分位数回归显示,除DOC>16 mg/L和TSS>80 mg/L的高值区间外,大部分预测值与实测值吻合良好。
【典型案例验证】
研究选取三个典型湖泊进行验证:1)佛罗里达州Okeechobee湖(图10)证明剔除云覆盖<10%的影像后,透明度预测误差降低42%;2)明尼苏达州McCarrons湖(图11)准确捕捉了2004年铝盐处理后的叶绿素a骤降过程;3)阿肯色州Beaver湖(图12)将DOC监测记录向前延伸18年,填补了历史数据空白。
这项研究创建了迄今最全面的湖泊水质遥感数据库,其重要意义体现在三方面:首先,将可监测湖泊的最小面积从文献报道的10公顷突破至4公顷,使小型水体纳入宏观生态研究成为可能;其次,开发的自动化工作流程支持全球其他区域的同类研究;最后,数据集与LAGOS-US平台的流域特征数据无缝衔接,为解析水质变化的驱动机制提供了前所未有的多维度数据支撑。正如作者强调的,该成果特别有助于解决水质监测中的社会公平问题——通过遥感技术弥补弱势群体聚居区的地面监测不足,为制定包容性环境政策提供科学依据。
生物通微信公众号
知名企业招聘