融合多源环境协变量的地理加权随机森林实现土壤重金属空间高精度预测与源解析

【字体: 时间:2025年09月22日 来源:Environmental Science Advances

编辑推荐:

  本文推荐一种融合地理加权回归(GWR)与随机森林(RF)优势的地理加权随机森林模型(GWRF),通过整合地形、空气质量、植被等多源协变量,显著提升土壤重金属(Cr、Pb、As、Hg)空间预测精度。测试集R2最高提升209.18%,并利用可解释机器学习技术(SHAP/MDI)揭示O3、地形和矿业活动为关键驱动因子,为环境风险评估与污染溯源提供新范式。

  

Highlight

土壤重金属空间预测模型对维护土壤生态系统健康、促进区域农业高质量发展及保障国家粮食安全具有关键意义。传统机器学习(ML)模型常忽略空间自相关性,导致预测精度受限。本研究采用随机森林(RF)的空间扩展模型——地理加权随机森林(GWRF),融合地形、空气质量、植被、土壤属性、人类活动和高光谱协变量,预测中国东部城市Cr、Pb、As、Hg的分布。GWRF表现最优,测试集R2达0.303 (Cr)、0.419 (Pb)、0.428 (As)和0.561 (Hg),较GWR和全局RF模型最高提升209.18%和53.28%。研究进一步探讨带宽与权重参数对GWRF性能的影响,发现选择合适的带宽及局部-全局模型结果融合策略可增强预测精度。可解释机器学习分析(MDI和SHAP)识别空气质量(尤其是O3)、地形、矿业距离和降雨为关键影响因子。GWRF生成的空间分布图显示高浓度区主要位于西北平原和中南部区域,且不同金属呈现异质空间模式。

Section snippets

Study area

研究区为山东省招远市,位于北纬37°05′–37°33′、东经120°08′–120°38′,属暖温带大陆性季风气候,年均温11.5°C,年均降水607.3毫米。地貌以低山丘陵为主,山地、丘陵和平原分别占比32.9%、38.4%和28.7%。

Descriptive statistical analysis

表1与图S2展示了研究区表层土壤重金属浓度统计特征与分布。Cr、Pb、As、Hg平均浓度分别为56.460、22.532、7.094和0.049 mg/kg。与背景值对比,Hg均值超标,Cr、Pb、As均值均低于背景值,但四种金属的最大值均显著超过背景值,表明存在局部富集现象。变异系数(CV)显示Hg呈强变异(CV=1.096),其他金属为中等变异(0.218–0.355),反映人类活动对Hg分布影响尤为显著。

Conclusions

土壤重金属含量预测与机理解释是本研究的核心。随机森林(RF)虽具高精度与鲁棒性,但其“全局性”限制了对局部空间变异的捕捉。为此,我们提出“空间机器学习”方法——地理加权随机森林(GWRF),应用于土壤重金属预测与解释。结果表明GWRF显著优于传统方法,为环境风险精准评估与污染治理提供有力工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号