
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于随机森林模型融合机载激光雷达与SNOTEL数据实现科罗拉多山区流域日尺度雪深估算
【字体: 大 中 小 】 时间:2025年08月10日 来源:Water Resources Research 5
编辑推荐:
这篇研究创新性地将随机森林模型(RF)与高分辨率机载激光雷达(LiDAR)和SNOTEL站点数据结合,开发了50米分辨率的日尺度雪深估算框架。通过时空数据迁移策略(包括局地历史数据和跨流域区域数据),模型在50米尺度上实现了0.37-0.44米的RMSE精度,上采样至流域尺度后误差降至0.10米。该研究显著提升了传统雪站数据的空间外推能力,为水资源管理和网格化雪产品验证提供了新范式。
研究团队开发了一种基于随机森林(Random Forest, RF)的机器学习框架,通过融合美国科罗拉多州14个流域的机载激光雷达(LiDAR)积雪深度数据和SNOTEL站点观测,构建了50米分辨率的日尺度雪深估算模型。该模型利用静态地形特征和动态积雪参数作为预测变量,以ΔSD(相对雪深异常值)为目标变量,实现了RMSE 0.37-0.44米的精度,优于现有高分辨率雪深产品。研究特别验证了时空数据迁移策略的有效性,证明区域联合训练能显著提升模型鲁棒性。
多源数据融合:整合了ASO提供的50米分辨率LiDAR雪深数据(2018-2024年)与NRCS的SNOTEL站点连续观测,引入地形指数(如TPI、Sx)和MODIS NDSI等动态变量。
创新建模策略:采用ΔSD=SD50-SDsnotel作为目标变量,将空间异常模式与站点实测值动态耦合,解决了时空连续预测的难题。
尺度适应性:模型在4公里和流域尺度的RMSE分别降至0.17米和0.10米,显著优于UASWE(0.31米)和原始SNOTEL(0.57米)数据。
数据基础:
覆盖科罗拉多州1,578-4,385米海拔梯度的14个流域,包含66次LiDAR飞行和48个SNOTEL站点形成的227组配对数据。
地形变量包括高程、坡度、南向指数(southness)、地形位置指数(TPI)和最大迎风坡(Sx),动态变量整合了站点SWE距平值和MODIS积雪覆盖率。
模型架构:
采用Breiman提出的随机森林算法,设置最小叶节点样本数100,通过OOB评估变量重要性。
设计三种训练场景:仅用流域内历史数据(Site-specific)、仅用跨流域数据(Regional)、混合训练(SS + Reg)。
精度验证:SS + Reg模型表现最优,50米尺度RMSE 0.37米,且对训练数据量不敏感(7次调查时误差仅降低2%)。
关键驱动因子:距离SNOTEL站点的空间距离(相对重要性1.0)、南向指数(0.8)和NDSI(0.6)是核心预测变量,而高程和植被覆盖度贡献较弱。
时序预测:在东河流域测试中,模型成功模拟了不同海拔带(低/中/高)的差异化消融曲线,但高海拔区雪后期存在高估(因训练集缺乏无雪数据)。
技术优势:
首次实现SNOTEL点数据向流域尺度的物理一致性扩展,解决了传统插值方法在复杂地形区的局限性。
通过区域数据迁移,使无LiDAR历史调查的流域也能获得可靠雪深估计(RMSE 0.44米)。
应用限制:
对极端雪深(如雪崩堆积区)预测能力有限,因RF框架受训练数据范围约束。
当前模型未整合雪密度模块,未来需耦合物理模型或数据同化技术推导SWE。
该研究为山区积雪监测提供了可业务化的技术方案,其"时空双迁移"训练策略显著提升了机器学习模型在异质性地形的泛化能力。研究成果已应用于科罗拉多河流域的水资源预报实验,并为下一代星载积雪遥感产品验证建立了新标准。
生物通微信公众号
知名企业招聘