机器学习与可靠性分析融合:应用深度森林算法预测生物炭重金属去除效率的新方法

【字体: 时间:2025年05月23日 来源:Ecotoxicology and Environmental Safety 6.2

编辑推荐:

  土壤重金属(HMs)污染威胁环境与健康,生物炭因特性成为修复利器,但其去除效率受多因素影响难稳定。研究构建深度森林(DF)模型,结合数据插补、增强及可靠性分析,DF 模型 R2 达 0.88,还开发了 web 应用,为修复提供新工具。

  土壤中的重金属污染如同隐藏的 “生态杀手”,锌、镉、砷等重金属凭借其难以降解的特性和生物富集能力,不仅破坏生态平衡,还通过食物链严重威胁人类健康。传统的热处理、土壤淋洗等修复技术,要么成本高昂,要么存在环境风险,而生物炭作为一种经济环保的碳质材料,虽因高孔隙率、大表面积和丰富官能团等特性在重金属固定中展现出潜力,但其效果受自身性质、土壤条件等复杂因素影响,难以稳定预测,且过往研究依赖有限异质数据集,存在数据缺失、噪声等问题,模型泛化能力不足,同时缺乏便捷的实际应用工具,这些都限制了生物炭在土壤修复中的广泛有效应用。
为突破这些瓶颈,国外研究人员开展了一项具有创新性的研究,相关成果发表在《Ecotoxicology and Environmental Safety》。

研究人员构建了一种先进的机器学习框架,核心是利用深度森林(DF)算法预测和优化生物炭对土壤重金属的去除效率。该研究整合了数据插补(处理缺失数据)、数据增强(解决小数据集限制)和可靠性分析(评估预测不确定性)等关键技术。数据来源于现有文献,经 k - 近邻(kNN)算法插补缺失值、隔离森林(IF)算法去除异常值后,得到 681 条可用数据,再通过条件生成对抗网络(CGAN)生成与原始训练集数量相等的合成数据,形成包含 1090 个数据点的增强训练集。以 DF 算法为核心模型,与线性回归、随机森林(RF)等多种传统机器学习模型对比,并运用五折交叉验证、引导法(bootstrap)等评估模型性能,同时借助 SHAP 值、部分依赖图(PDP)解析模型,利用蒙特卡洛方法进行可靠性分析,还开发了网页应用程序。

3.1 数据增强的影响


通过对比使用初始训练集和增强训练集时 DF 模型的性能发现,增强训练集使模型在训练阶段的均方误差(MSE)从 0.023 降至 0.012,决定系数(R2)从 0.92 提升至 0.96;测试阶段 MSE 从 0.048 降至 0.029,R2 从 0.80 提升至 0.88,表明数据增强有效减少误差,提升模型性能。

3.2 与以往 ML 模型的对比分析


在与多种传统 ML 模型的对比中,DF 模型表现卓越。训练阶段,其 R2 达 0.96,MSE 和平均绝对误差(MAE)分别为 0.012 和 0.075;测试阶段 R2 为 0.88,均优于线性回归(R2=0.40)、随机森林(R2=0.81)等模型,说明 DF 模型能更好捕捉数据复杂关系,泛化能力强。

3.3 DF 模型解释


SHAP 分析显示,生物炭剂量是影响重金属去除效率的最关键因素,剂量增加可通过提供更多吸附位点提升去除效率,但超过一定范围后边际效益递减。土壤有机碳(OC)、砂含量、灰分含量(Ash)和土壤中有效重金属(AHMs)等也有重要影响。部分依赖图进一步揭示,生物炭剂量在 2-10% 范围内与去除效率呈正相关,土壤 pH 在 4-5.5 时利于去除,而 AHMs 浓度升高会降低去除效率。

3.4 概率评估和可靠性分析


引导法评估模型稳健性表明,DF 模型的 MSE、MAE 最低,R2 最高,可靠性强。超越概率曲线显示,当去除效率(RE)低于 25% 时,概率超 80%;RE 为 40% 时概率约 40%;RE 超 70% 时概率低于 5%,反映出实现高去除效率的难度。

3.5 网页应用


开发的网页应用(https://streambiochar.streamlit.app)允许用户输入参数,实时获取预测结果,操作便捷且跨平台,推动了模型从研究到实际应用的转化。

3.6 局限性和未来工作


研究存在一定局限性,如网页应用未经过高并发测试,模型缺乏与实际田间数据的对比验证。未来需开展高负载场景测试,通过田间试验验证模型,还可纳入更多生物炭性质参数,探索与其他修复技术的联合应用。

这项研究通过机器学习与可靠性分析的创新融合,显著提升了生物炭修复土壤重金属污染的预测能力和应用便捷性。DF 模型的优异表现为复杂环境下的修复效果预测提供了新范式,概率分析为实际应用中的风险评估提供了科学依据,而网页应用则降低了技术门槛,推动了数据驱动的环境修复决策。研究成果不仅深化了对生物炭作用机制的理解,更为全球土壤修复提供了可扩展的实用框架,有望在可持续环境治理中发挥重要作用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号