一个用于利用40年的Landsat观测数据估算美国大陆悬浮沉积物的机器学习框架
《Science of The Total Environment》:A machine learning framework for estimating suspended sediment continental United States using 40 years of Landsat observations
【字体:
大
中
小
】
时间:2025年11月15日
来源:Science of The Total Environment 8
编辑推荐:
悬浮泥沙浓度(SSC)监测对水生态和基础设施管理至关重要。本研究基于Landsat卫星40年数据与247个USGS站点实测数据,构建全国尺度SSC估算框架,对比直接预测SSC与ln(SSC)两种模型。结果显示,ln(SSC)模型在变换域表现更优(R2=0.84),但回代后性能(R2=0.55)略低于直接预测模型(R2=0.59)。SHAP分析表明光谱指数(B3/B2、MNDWI)、地形变量(DEM、SPI)及时空特征(经纬度、月份)是主要驱动因子。空间趋势呈现从东到西浓度递增,干旱区升高显著;季节峰值在科罗拉多河(雪融驱动)和密西西比河(春汛)尤为突出。研究验证了两种模型在长期监测和短期敏感度上的互补性,为流域管理、水库规划及生态保护提供可解释的解决方案。
悬浮沉积物浓度(SSC)对水生生态系统有着深远的影响,它不仅关系到水质状况,还与营养物质的输送、基础设施的耐久性密切相关。准确监测SSC对于有效的环境管理和水资源保护至关重要。本研究提出了一种覆盖美国全国范围的SSC估算框架,通过整合Landsat卫星地表反射数据与美国地质调查局(USGS)的247个站点的实地测量数据(从1984年至2024年间原始数据包含1400个站点),评估了两种建模策略:一种是预测SSC的自然对数(ln(SSC)),另一种是直接预测SSC值。两种模型均采用了机器学习方法,结合了光谱指数(如B3/B2、MNDWI)、地形变量以及空间时间特征(纬度、经度、月份)等输入参数。结果显示,在对数变换空间中,ln(SSC)模型表现最佳,其决定系数(R2)达到0.84,均方根误差(RMSE)为0.64;而在反变换后,其性能(R2=0.55,RMSE=594 mg/L)略逊于直接预测SSC模型(R2=0.59,RMSE=565 mg/L)。CatBoost等集成学习方法在两种策略中均表现出卓越的性能。
SHAP(SHapley Additive exPlanations)分析进一步验证了模型输出的显著影响因素,包括红绿光谱比值、近红外波段、红光波段、MNDWI(最小非植被指数)以及数字高程模型(DEM)等变量。这些变量的显著性与主要河流中已知的沉积物动态趋势相吻合。空间趋势分析揭示了从东向西逐渐增加的沉积物浓度分布模式,尤其是在干旱地区表现更为明显。季节性峰值则主要出现在由融雪驱动的河流系统,如科罗拉多河,以及春季洪水脉冲在密西西比河中观察到的高沉积物浓度现象。这些发现表明,模型在不同时间尺度上的表现存在一定的权衡:对数变换模型在长期稳定性与可解释性方面表现更优,而直接预测模型则在短期敏感性和绝对值估算方面更具优势。此外,反变换后的对数模型表现与直接模型相当,表明两者在短中期监测中均可提供相近的精度。
SSC的准确估算对于预测水库淤积、设计防洪工程和水道通行项目、以及评估下游沉积物预算具有重要意义。不准确的预测可能导致错误的洪水风险分析和污染物负荷评估,进而影响基础设施投资和监管决策。相比之下,可靠的SSC估算有助于识别高沉积物事件(如洪水激增)和长期趋势,这对规划清淤作业、优化沉积物管理政策以及降低水坝和水道的维护成本至关重要。然而,频繁的水样采集进行SSC测量不仅耗时费力,而且在许多河流中难以实现全面覆盖。因此,开发一种能够支持全国范围实时监测的SSC模型,对于实现对沉积物动态的及时管理、促进生态保护和水质管理具有关键作用。
在美国,SSC的估算尤为重要,因为该国拥有多种水文区域和广泛的水基础设施。过量的沉积物是美国河流水质退化的主要原因之一,影响航运、增加水处理成本,并破坏水生生态系统。此外,水库中的沉积物堆积会缩短其使用寿命,并需要昂贵的清淤作业,而下游输送的沉积物则会影响海岸侵蚀和湿地的可持续性。因此,建立一个覆盖全国的SSC监测系统,对于管理土壤保护和防洪工程至关重要。尽管USGS运营了数百个沉积物监测站点,但即便如此,这些站点也无法全面捕捉沉积物输运的空间和时间变化。
以往的研究采用多种方法来估算SSC,许多早期研究开发了特定地点的实证模型,如将径流与SSC相关联的沉积物评级曲线,这些模型通常依赖于本地的实地测量进行校准(Kong et al., 2019; Trinh et al., 2020; Liu et al., 2020; Stull and Ahmari, 2024)。虽然这些模型在特定地点具有实用性,但它们往往缺乏在不同流域或水文条件下的普适性;即使使用替代方法(如连续浊度监测),其应用也局限于已安装仪器的站点(Doxaran et al., 2002; Xiao et al., 2023)。与此同时,卫星遥感技术作为区域到全球范围覆盖的重要工具,为稀疏的实地监测提供了有力补充(Montanher et al., 2014; Zhang et al., 2022; Zhou et al., 2017)。许多研究已经将多光谱卫星影像(如Landsat、Sentinel)与实地SSC测量数据相结合,以绘制不同河流、河口和沿海水域的沉积物浓度图(Cao et al., 2022; Mohsen et al., 2023; Zaghian et al., 2023; Zhang et al., 2020)。这些遥感方法能够生成连续的SSC地图,揭示诸如下游浓度增加和河口沉积物滞留等输运模式(Flores et al., 2020; Hu et al., 2023; Liu et al., 2021)。长期的卫星记录使得对沉积物动态的回顾性分析成为可能,揭示了与人类活动和气候变化相关的多十年SSC趋势(Qiu et al., 2024; Zhang et al., 2014; Zhou et al., 2017)。
近年来,研究人员利用新的数据来源和先进的建模技术进一步提升了SSC估算的准确性。机器学习(ML)方法在水文预测方面展现出强大的能力,包括径流、蒸散发和沉积物输运等复杂非线性关系(Dalavi et al., 2024; Gomaa et al., 2023; Joshi et al., 2024; Peterson et al., 2018; Sandilya et al., 2025; Shaloo et al., 2024)。此外,将多平台卫星观测数据与大量实地记录融合,使得SSC监测覆盖了前所未有的空间尺度和时间跨度(Loisel et al., 2014; Wackerman et al., 2017; Zhang et al., 2014)。这些进展标志着SSC模型正逐步向更具普遍性和准确性的方向发展,超越了早期特定地点或单一传感器研究的局限。然而,尽管取得了这些进展,仍然缺乏能够同时结合长期卫星存档、全国范围实地数据集和可解释AI技术的SSC模型。大多数先前研究要么时间跨度较短,要么空间范围有限,或专注于黑箱预测,缺乏可解释性。本研究填补了这一空白,提供了一种空间范围广泛、时间跨度深远且完全可解释的SSC建模框架。同时,最近的研究也展示了遥感技术在土地退化和侵蚀监测方面的更广泛应用,例如Aziz(2024)利用Landsat数据监测地中海三角洲的海岸侵蚀趋势,Rattanarat等人(2024)评估了东南亚政府主导的土地利用变化,而Nze和Agunwamba(2024)则利用遥感技术估算热带湿润流域的土壤流失。这些研究共同强调了遥感和空间建模技术在不同环境背景下的沉积物和土地变化分析中的广泛应用价值。
尽管近期研究探索了使用更高分辨率传感器(如Sentinel-2)和更先进模型(如深度学习)进行SSC预测,但这些研究往往受限于空间覆盖范围、时间跨度或可解释性。相比之下,本研究利用40年的Landsat数据存档,结合超过16000个实地测量数据,构建了一个具有可扩展性和普适性的SSC预测框架。此外,本研究不仅依赖于黑箱建模,还应用了基于SHAP的可解释性分析,以量化光谱、空间和时间预测因子的相对重要性。SHAP依赖图(补充图S2、S3)进一步阐明了这些预测因子如何单独或交互影响模型输出,特别是在直接和对数变换SSC模型中。这种透明度有助于更清晰地理解沉积物动态和模型行为,这是许多深度学习应用中普遍缺乏的。将长期卫星数据、机器学习和可解释AI技术相结合,标志着在大陆尺度上实现操作可行的沉积物监测的新进展。
本研究基于这些近期进展,开发并评估了一种大陆尺度的SSC预测框架,整合了40年的Landsat地表反射数据与大约1400个USGS站点的实地测量数据(经过数据筛选后减少至247个站点)。选择了美国的四条主要河流——科罗拉多河、密西西比河、哥伦比亚河和哈德逊河,这些河流涵盖了多种水文条件和沉积物输运行为,包括由融雪驱动的系统、农业影响的流域以及城市河口。这种多样化的河流系统为模型的开发和验证提供了坚实且具有代表性的测试平台。本研究旨在通过利用长期的卫星存档和可解释的机器学习技术,弥合局部尺度SSC模型与大陆尺度沉积物预测之间的差距。这些方法共同提供了一套强大且可解释的工具,用于大规模沉积物监测和水资源管理。本模型不仅服务于科学研究,还为实际应用提供了宝贵的见解。其实时SSC监测能力为沉积物预算估算、水库规划、洪水控制和生态恢复过程提供了可靠的工具。本文的其余部分结构如下:第二部分详细介绍了研究区域、数据来源和模型开发;第三部分展示了结果和时空分析;第四部分讨论了更广泛的影响,并与以往研究进行了比较;第五部分总结了关键发现,并展望了未来研究的方向。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号