综述:机器学习模型预测新兴潜在污染物在植物中的吸收:全球综述(2018-2025)

【字体: 时间:2025年07月03日 来源:Results in Engineering 6.0

编辑推荐:

  这篇综述系统总结了2018-2025年间机器学习(ML)模型在预测新兴污染物(CECs)植物吸收中的应用进展,重点分析了随机森林(RF)、梯度提升回归树(GBRT)等集成算法和深度神经网络(DNN)等模型的性能优势,揭示了土壤pH、有机质等关键预测因子,同时指出当前研究存在地理分布不均(中国占82.1%)、数据标准化不足等局限性,为环境风险评估和植物修复技术发展提供了重要参考。

  

机器学习在植物污染物吸收预测中的应用进展

Abstract
这篇综合性综述(2018-2025)系统分析了机器学习(ML)模型预测新兴潜在污染物(CECs)植物吸收的研究进展。CECs是由人类活动驱动的全球性问题,其植物吸收对生态修复和食品安全至关重要。ML提供了强大的预测工具,有助于生态系统保护、人类健康和可持续发展。综述分析了多种ML算法,包括集成模型(随机森林、梯度提升回归树、极限梯度提升)和深度学习(深度神经网络、循环神经网络、长短期记忆网络),以及关键预测因子如土壤pH、有机质和植物性状。研究揭示了主导预测因子和建模方法,同时指出显著的研究空白:数据有限、特征报告不一致以及不确定性-敏感性耦合研究不足。值得注意的是存在地理不平衡现象,中国主导了相关研究(占28项研究的82.1%),其次是美国(14.3%)和意大利(3.6%)。尽管非洲水体(包括用于灌溉的水体)普遍存在CEC污染且农业脆弱性高,但非洲特别是南非的研究明显不足。这表明在解决作物污染物风险方面存在关键差距,鉴于现有模型主要基于中国数据训练,需要对非洲环境进行模型再训练或迁移学习。研究结果强调了建立标准化数据库、开展全球敏感性和不确定性分析以及扩大地理代表性的紧迫性,以增强模型的普适性和可解释性。

  1. Introduction
    21世纪初,人工智能(AI)经历复兴,机器学习(ML)因其预测复杂事件的能力受到广泛关注。ML作为AI的分支,通过处理大量标记训练数据来识别模式和关联,进而预测未来结果。在植物污染物吸收预测方面,传统经验回归和机械模型曾广泛应用,但这些方法往往难以准确表征植物-土壤-污染物相互作用的复杂动态。ML模型的关键优势在于不依赖假设即可发现数据模式,其算法主要分为监督和非监督模型。监督ML模型需要标记数据集进行预测,可进一步分为回归和分类两个子类型;非监督模型则处理未标记数据,采用降维和聚类等技术。

传统机械和经验模型在表征植物-土壤-污染物相互作用时面临诸多固有局限,如高度复杂性和参数化、植物生长的静态表征、土壤-植物系统的过度简化等。植物对污染物的吸收受多种相互作用因素影响,包括土壤性质(pH、有机质、微生物群落、水分含量)、污染物特性(挥发性、溶解度、吸附行为)、植物性状(根系结构、脂质含量、蒸腾速率、代谢)和环境条件(温度、降雨、空气流动)。传统模型常难以纳入这些相互作用的全部复杂性,可能导致低估或高估污染物吸收,造成风险评估不准确和缓解策略失效。

  1. Plant uptake and translocation factors of potential CECs
    工业化推动了农业、制造业、个人护理和制药中合成化学品的广泛生产。微塑料和药物等环境污染物因其持久性、生物累积性和潜在生态毒性成为重大挑战。全氟烷基物质(PFAS)作为表面活性剂、防水喷雾等被广泛应用。合成农药的使用在保护作物免受病虫害方面具有益处,但持久性和生物累积性CECs也带来了意外后果。

植物吸收通常通过植物稳定化相关指标表示,包括生物浓缩因子(BCF)、根浓度因子(RCF)、生物累积系数(BAC)、生物累积因子(BAF)和植物吸收因子(PUF)。BCF和RCF描述污染物在植物根部与土壤中的浓度比,值大于1表示根部污染物积累高于土壤。BAC是植物地上部与土壤中污染物浓度比,较高值表明污染物从土壤向地上部迁移能力较强。BAF类似于PUF,是整个植物(根+地上部)与土壤中污染物浓度比,提供植物从土壤累积污染物的总体度量。RCF大于1但BAC低的植物适合植物稳定化,而BAC和BAF高的植物更适合植物提取。

  1. Conclusion and perspectives
    本综述首次全面综合了2018-2025年间应用ML模型预测植物吸收环境污染物的研究进展,涵盖了多种污染物(重金属、有机污染物、工程纳米颗粒和非金属)、植物种类、暴露途径和建模方法。分析表明,集成模型如RF、GBRT和XGBoost始终表现出强大的预测性能,而DNN、RNN、LSTM等深度学习模型虽在兴起但仍受数据可用性和过拟合风险限制。土壤pH、有机质、分子描述符和植物生理性状等关键预测因子持续驱动不同污染物类型的吸收变异。然而,当前研究仍集中在中国(超过80%研究),模型输入、输出和评估指标缺乏标准化。这凸显了在南非等面临独特环境污染挑战、拥有多样化植物物种的地区开展类似综合研究的必要性,以开发适合当地的环境风险评估和植物修复策略预测模型。为提高模型稳健性、可解释性和全球适用性,未来研究应聚焦于扩展地理数据集、标准化特征报告、全球敏感性和不确定性分析(GSUA),以及结合机械知识与先进ML的混合模型开发。本综述为推进预测性植物修复、环境风险评估和环境科学中AI整合提供了重要参考。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号