
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Shapley加性解释的土壤pH驱动机制与影响因素研究
【字体: 大 中 小 】 时间:2025年07月31日 来源:CATENA 5.7
编辑推荐:
研究人员针对土壤pH空间分布机制解析难题,采用机器学习结合Shapley值(SHAP)方法,分析了俄罗斯南乌拉尔地区2651份土壤样本数据,揭示了气候(降水、云量)、海拔和土壤类型是影响0-60 cm土层pH的关键因子,构建了预测精度达54-62%的深度分层模型,为半干旱区土壤健康管理提供了量化依据。
土壤酸碱度(pH)作为调控养分循环和生态功能的"土壤晴雨表",其空间异质性机制解析一直是环境科学领域的难点。传统研究中,机器学习模型虽广泛应用于土壤属性预测,但"黑箱"特性阻碍了机理阐释——正如俄罗斯巴什科尔托斯坦共和国9500平方公里区域内,山地森林向半干旱草原过渡带中pH的突变现象长期缺乏量化解释。
针对这一挑战,乌法国立石油技术大学(Уфимский государственный нефтяной технический университет)人工智能环境研究实验室的Azamat Suleymanov团队创新性地引入博弈论衍生的Shapley加性解释(SHAP)方法,对2651份分层土壤样本(0-20 cm、20-40 cm、40-60 cm)展开多尺度分析。这项发表在《CATENA》的研究,首次实现了土壤pH垂直分异规律的机器学习和可解释性分析的深度融合。
研究采用随机森林(Random Forest, RF)算法结合SHAP值分解技术,整合气候(降水、云量、地表温度)、地形(海拔)、植被和母质等32个环境协变量。通过特征重要性排序和边际效应分析发现:12月降水超过30-35 mm、云量达58-60%、海拔400-450 m时,各土层pH均显著低于平均水平。模型解释力随深度递减(R2=0.62→0.54),但成功捕捉到降水淋溶与蒸散发盐分累积的拮抗效应——这正是森林向草原过渡带pH升高的核心驱动力。
【关键技术方法】
团队采集巴什科尔托斯坦共和国政府土壤调查数据,运用SHAP值量化预测变量贡献度,构建深度分层RF模型。采用10折交叉验证评估性能,通过局部依赖图解析非线性关系,最终生成空间预测图及不确定性分布。
【主要研究发现】
模型性能
• 预测精度随深度递减:0-20 cm层R2=0.62(RMSE=0.42),40-60 cm层R2=0.54(RMSE=0.55)
• 纳什效率系数(NSE)0.53-0.62,优于同类空间模型
驱动因子解析
• 气候因子贡献度超35%:12月降水阈值效应显著
• 海拔400-450 m出现pH突变拐点
• 土壤类型对深层(40-60 cm)pH影响增强
空间格局
• 山地森林区pH较草原低0.8-1.2个单位
• 东西向梯度变化速率达0.15 pH单位/km
【结论与意义】
该研究通过可解释AI破解了土壤pH的"深度密码":
生物通微信公众号
知名企业招聘