为了提高对浅水、地貌复杂的河口区域中细小悬浮沉积物的空间分辨估计精度
《Ocean Modelling》:Toward improved spatially-resolved estimates of fine suspended sediment in shallow morphologically-complex estuaries
【字体:
大
中
小
】
时间:2025年08月12日
来源:Ocean Modelling 2.9
编辑推荐:
本研究开发了一种混合模型,结合Delft3D-Flow数值模拟与Sentinel-2卫星遥感数据,通过K-means聚类和随机森林回归纠正悬浮泥沙浓度(SSC)预测误差,在ōhiwa港实现高精度(R2=0.71,MAE=5.45-6.05 mg/L)的时空连续SSC监测,为潮间带海岸带韧性评估提供工具。
在沿海生态系统中,悬浮沉积物浓度(SSC)扮演着至关重要的角色。作为沿海生态系统动态的一部分,悬浮沉积物不仅影响地貌特征,还控制着水体中的光透射率,并作为污染物的运输媒介。因此,大规模监测悬浮沉积物浓度对于理解湿地的适应能力,从而保护周围的沿海生态系统具有重要意义。本文提出了一种新的模型,旨在通过结合间歇性卫星观测和基于过程的数值模拟(Delft3D-Flow)来实现对当前和未来河口环境中悬浮沉积物浓度的连续估计。这种模型的开发解决了传统数值模拟在精度和适用性上的不足,特别是在复杂潮间带河口地区,由于难以获取足够的现场验证数据,使得模型的准确性难以提高。
### 模型的开发与应用
该模型的构建分为两个步骤。首先,通过将Delft3D模拟得到的SSC与校正后的卫星数据进行比较,并利用K-means分类方法对差异进行分类。其次,为每个分类开发了一个随机森林回归模型,利用Delft3D模拟的SSC以及其他物理参数作为输入,预测由卫星数据得到的SSC。这种结合方式不仅提高了模型的准确性,还使得预测结果能够更真实地反映实际的沉积物分布情况。通过对比短时间部署的现场传感器数据、长期监测数据以及基于卫星的估计,新模型在预测SSC方面表现出显著的提升,达到了R2 = 0.71,平均绝对误差(MAE)在5.45至6.05 mg·L?1之间。
### 研究区域与数据
研究区域是新西兰的ōhiwa港,这是一个面积约为26.4平方公里的潮间带河口,被两个沙质屏障所包围。该港主要由浅水区域构成,其中约83%的面积在低潮时由露出水面的沙地和淤泥地组成。港口的填积和快速变化主要受到来自开阔海岸的沉积物输入影响,尤其是在港口入口处,由于水流通道的形成,沉积物的输送尤为明显。港口周围的潮间带湿地以红树林(*Avicennia marina* subsp. *australasica*)为主,这种植被在缓冲风暴影响方面发挥着重要作用,有助于减少波浪侵蚀,减缓洪水期间水流峰值,并促进沉积物和营养物质在潮间带的沉积。
为了构建该模型,研究者利用了Sentinel-2卫星的Level-2A大气校正数据产品,并结合Delft3D-Flow模型的水动力和悬浮沉积物模拟结果。研究选取了47幅2018年至2022年间拍摄的Sentinel-2图像,这些图像具有10米的分辨率,且云覆盖率低于5%。此外,还进行了现场调查,使用Nortek Aquadopps设备在Site 1至Site 5收集了水动力和悬浮沉积物的现场观测数据。这些数据不仅用于校准Delft3D模型,还用于建立将卫星反射率转换为SSC的转换关系。
### 方法与模型设计
模型开发采用了两种机器学习技术:K-means分类和随机森林回归。K-means分类用于根据卫星和Delft3D模拟数据之间的差异将像素划分为不同的类别,而随机森林回归则用于为每个类别构建校正模型,从而提高预测精度。为了评估差异,研究者计算了每个像素的平均绝对误差(MAE),并利用K-means算法将需要相同校正的区域进行分类。K-means是一种无监督学习算法,通过计算像素之间的欧几里得距离,将数据划分为预定义的类别。
在模型训练过程中,研究者引入了“差异指数”(Dissimilarity Index)来降低数据中的自相关性。该指数通过计算每个像素与其邻近像素之间的绝对差异,并根据逆欧几里得距离进行加权,以识别可靠预测区域。通过这种方式,模型能够更准确地捕捉到数据中的空间模式,从而提高预测的稳定性。经过五折交叉验证,研究者确认了随机森林模型的最优参数设置,包括估计器数量和最大深度。
### 模型性能评估
模型在测试数据上的表现显示出良好的预测能力,整体的R2值达到0.71,MAE值为5.71 mg·L?1。这种性能超过了仅依赖Delft3D模拟的预测结果,后者在相同测试数据下的MAE值为11.42至12.43 mg·L?1。在五个现场监测站点中,模型的预测结果显示出显著的改进,特别是在那些具有较长时间序列数据的站点。此外,模型还成功捕捉到了SSC的变化趋势,如从大潮到小潮的转变,以及这些变化与水位梯度和距离到河口出口的关系。
通过将Delft3D模拟的SSC与随机森林校正后的结果进行对比,研究者发现模型在某些区域仍存在低估的问题,但总体的MAE值显著降低,从21.24 mg·L?1降至13.10 mg·L?1。这表明,尽管模型仍有改进空间,但其在大规模预测SSC方面展现出了良好的潜力。同时,研究者还利用长期监测数据验证了模型的有效性,发现其在预测沉积物积累率方面优于传统的Delft3D模型,达到了3.1 mm·y?1,接近现场测量的2.8 mm·y?1。
### 机器学习在模型中的作用
随机森林算法在该研究中被证明是一种有效的工具,能够处理复杂的非线性关系,并在存在异常值的情况下仍保持较高的预测精度。该算法通过构建多个独立的回归树,利用不同的数据子集进行训练,从而减少单个数据子集中的异常值对整体模型的影响。此外,随机森林还表现出较强的抗过拟合能力,通过随机选择变量进行树的划分,避免了模型对特定变量的过度依赖。
研究还发现,某些变量对模型的预测性能具有更大的影响,如Delft3D模拟的SSC、水位梯度和风速。这些变量在模型中占据较高的重要性比例,表明它们在预测SSC时起到了关键作用。相比之下,距离和水深对模型的影响较小,这可能是因为这些参数在一定程度上被其他更相关的变量所覆盖。尽管如此,模型仍然能够有效捕捉到SSC的空间分布模式,包括在港口入口和水陆交界处较高的SSC值,以及在港口中心区域较低的SSC值。
### 限制与未来方向
尽管该模型在预测SSC方面表现出色,但仍存在一些局限性。首先,用于去除浅水区域海底反射率的修改版Lyzenga模型可能引入误差,特别是在非均匀沉积物属性的区域。此外,研究者发现,红光波段(Band Red)与现场测量SSC之间的对数回归关系的R2值相对较低(0.63),这可能是导致预测误差的原因之一。因此,未来的研究应进一步探索不同的机器学习算法,并考虑更多可能影响SSC的因素,如降雨和风暴潮等。
另一个限制是,该研究使用的是二维、深度平均的水动力模型,这可能无法完全捕捉到三维流动和沉积物输运过程,尤其是在垂直变化显著的深水通道中。虽然通过引入差异指数降低了自相关性的影响,但在整个港口范围内的应用仍可能导致模型的过拟合。因此,未来的工作可以考虑引入正则化和惩罚项,以优化模型的性能。此外,模型未考虑风浪对沉积物再悬浮的影响,尽管风速和距离到河口出口已被纳入,但未来的研究可以进一步将风浪纳入基础动态模型中,以提高预测的准确性。
### 模型的应用前景
该模型不仅适用于短期的SSC监测,还可以用于长期的沉积物预算评估。通过结合卫星数据和现场观测,模型能够提供更精确的空间和时间上连续的SSC预测,这对于沿海管理决策具有重要意义。例如,该模型可以用于监测大规模的沉积物输运过程,评估沿海环境的负载限制,并为预测海床光条件、支持湿地初级生产力的提升提供依据。随着机器学习技术的不断发展,未来可以进一步优化模型,使其在更广泛的沿海环境中具有更高的适用性。
综上所述,本文提出的随机森林校正模型为提高河口地区悬浮沉积物浓度的预测精度提供了一种新的方法。该模型通过结合卫星观测和数值模拟,克服了传统方法在数据获取和模型校准方面的不足,特别是在资源有限的环境中。这种模型不仅能够提供准确的SSC分布图,还能够为沿海生态系统的保护和管理提供科学依据。未来的研究应继续探索如何进一步优化模型,使其在更复杂的水文条件下具有更强的适应性和预测能力。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号