基于IPCW-RF模型与SHAP解释的喜马拉雅东段土壤厚度空间分异机制研究

【字体: 时间:2025年10月12日 来源:CATENA 5.7

编辑推荐:

  本文创新性地提出融合逆概率加权随机森林(IPCW-RF)与SHAP解释框架的研究方法,有效解决了土壤厚度(ST)预测中普遍存在的右删失数据偏差问题。通过在喜马拉雅东段(500–7000 m)构建包含130个剖面与多源环境变量的数据集,模型实现了较高预测精度(R2=0.55),并揭示海拔梯度上植被-地形因子的驱动机制转换规律,为复杂地形区土壤形成过程解析提供新范式。

  
Highlight
土壤厚度(ST)空间分布与不确定性量化
随机5折交叉验证(CV)表现不佳(R2≈0.20),而结合最近邻距离匹配(kNNDM)CV与特征筛选后,模型预测性能显著提升(R2=0.55;平均绝对误差MAE=18.09 cm;均方根误差RMSE=21.59 cm)。预测ST范围介于8.99–136.41 cm,呈现明显的西-东梯度差异:雅鲁藏布江谷地及缓倾高原面集中分布高ST值,而高海拔陡坡区ST较薄。模型在海拔500–2500 m区间预测性能最佳(R2>0.6),但在>5000 m区域不确定性显著增加。
ST建模与制图
精准的ST制图是解析环境驱动机制的基础。采用特征筛选的IPCW-RF模型结合kNNDM CV,有效克服了稀疏采样点空间自相关引起的偏差。Sentinel-2波段8(近红外)作为全局主导预测因子,其重要性在低海拔区尤为突出。SHAP分析显示:海拔500–2500 m以植被因子主导;2500–4500 m植被与地形共同作用;>4500 m则转为地形控制主导。这种海拔依赖的驱动机制转换,揭示了冰川作用、风化-侵蚀平衡对ST分异的多尺度调控。
结论
本研究通过IPCW-RF模型与SHAP解释框架的创新融合,系统揭示了喜马拉雅东段ST的海拔分异规律。模型成功校正了右删失数据偏差,Sentinel-2光谱数据显著提升了陡峭地形的预测能力。环境因子的驱动作用呈现海拔梯度上的动态更替:低中海拔依赖植被调控,中高海拔受植被-地形协同作用,极高海拔则转为地形主导。该研究为复杂地形区土壤碳储量评估与地质灾害风险预警提供了方法论支撑。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号