
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于空间异质性分析和机器学习模型的山坡区域覆盖层厚度预测研究
【字体: 大 中 小 】 时间:2025年06月30日 来源:Geoscience Frontiers 8.5
编辑推荐:
针对山坡区域覆盖层厚度(OLT)空间异质性强、样本采集困难导致的预测精度不足问题,研究人员整合野外调查、遥感解译和地质钻探数据,结合合成少数类过采样技术(SMOTE)和随机森林回归(RF)模型,构建了OLT预测新框架。该研究在黄坦镇案例中取得Pearson相关系数0.84、RMSE 1.173的优异性能,为滑坡敏感性预测和边坡稳定性分析提供了高精度数据支撑。
在山坡区域,覆盖层厚度(Overburden Layer Thickness, OLT)的精确预测是滑坡灾害预警和边坡稳定性评估的关键参数。然而,OLT的空间分布具有显著异质性——水平方向上受地形、水文等多因素耦合影响,垂直方向上呈现坡顶、坡中、坡底的突变特征。传统物理模型难以刻画这种复杂性,而样本采集的高成本(需地质钻探和野外勘测)又制约了数据驱动方法的精度。更棘手的是,坡顶等关键区域样本稀少且分布不均,导致预测模型易出现系统性偏差。这些瓶颈严重限制了地质灾害风险评估的可靠性。
针对这一挑战,中国的研究团队在《Geoscience Frontiers》发表创新性研究,提出融合空间异质性分析和机器学习技术的OLT预测框架。研究以浙江黄坦镇187.8 km2的山坡区域为案例,通过三阶段技术路线突破传统局限:首先整合3415个野外调查样本、210个遥感解译样本和26个钻孔数据,构建高密度(22.8样本/km2)异构数据库;继而采用概率分布分析和坡位分类揭示OLT的水平和垂直异质性特征;最后引入SMOTE算法平衡样本分布,结合16种地形水文因子(包括创新性采用的坡位指标),建立加权随机森林回归(RF)预测模型。
关键技术方法包括:(1)多源数据采集:结合ASTER GDEM遥感数据、Landsat-8 TM影像和地质资料;(2)空间异质性量化:通过概率分布统计和坡位分类(脊部、上坡、中坡等6类)解析OLT分布规律;(3)样本优化:采用SMOTE算法对稀少厚层样本(4-15m区间)进行合成扩增;(4)机器学习建模:基于贝叶斯优化的RF回归(参数:n_estimators=270, max_depth=360)构建预测框架;(5)性能验证:使用Pearson系数、RMSE、MAE和Lin's CCC四重指标评估。
3.1 研究区OLT分布特征
通过3415个野外样本和210个遥感样本分析发现,黄坦镇OLT呈现"东西厚、中部薄"的格局(均值1.25m),其中0-1m薄层占比60.6%,5-15m厚层仅2.9%。垂直方向上,典型边坡剖面显示OLT突变特征——大岭头村边坡中段出现7-9m厚层,而底部仅1-2m,揭示坡位对OLT的强控制作用。
3.3 关键影响因子筛选
创新性引入坡位因子(通过6×6邻域TPI算法计算),结合15种传统地形水文因子(如坡度、TWI、SPI)。RF模型特征重要性分析表明,坡位、坡度、TWI和SPI构成核心因子集。特别发现中坡位OLT最厚(>2m),而TWI、SPI与OLT呈对数负相关,这与地质沉积规律高度吻合。
4.1 预测结果验证
模型在187.8 km2范围内实现0.84的Pearson相关系数,RMSE仅1.173m。钻孔验证显示最大误差0.79m,且历史滑坡82%分布于预测厚层区(>3m),证实模型可靠性。概率分布对比显示,预测结果成功保留了样本集的"薄层主导"特征(0-1m占比45.27%),同时准确捕捉到5-15m厚层的空间分布。
5.3 研究局限性
尽管取得突破,该框架仍存在三方面局限:(1)未耦合物理风化过程模型,影响机制解释性;(2)人类活动(如道路建设)对OLT的动态影响未量化;(3)在样本稀疏区域(<2.8样本/km2)适用性待验证。作者建议未来结合转移学习技术,构建"物理-数据"双驱动模型以突破这些限制。
这项研究的意义在于建立了首个整合空间异质性解析与机器学习优化的OLT预测体系。通过坡位因子和SMOTE算法的创新应用,有效解决了山坡区域OLT预测中的样本不平衡和空间非连续性问题。其成果不仅为地质灾害预警提供高精度基础数据,更为复杂地质属性的空间预测提供了可推广的方法论框架。特别是22.8样本/km2的采样密度标准,为同类研究树立了数据质量控制的新标杆。随着极端气候事件频发,这种高效可靠的OLT预测技术将在山区防灾减灾中发挥日益重要的作用。
生物通微信公众号
知名企业招聘