机器学习预测生物脱氮过程中抗生素抗性基因丰度变化的关键因素与调控策略

【字体: 时间:2025年06月22日 来源:Journal of Environmental Management 8.0

编辑推荐:

  为解决污水处理厂(WWTPs)中抗生素抗性基因(ARGs)传播风险难以量化的问题,研究人员采用CatBoost、随机森林(RF)等机器学习(ML)模型,首次系统预测了生物脱氮(BNR)过程中ARGs和移动遗传元件(MGEs)丰度变化。研究发现MGEs丰度变化是预测ARGs的关键特征,并揭示了变形菌门(Proteobacteria)等微生物群落特征与环境因子的协同作用,最终开发了指导ARGs风险管控的可视化平台,为污水处理过程优化提供了新方法。

  

抗生素抗性基因(ARGs)的传播已成为21世纪最严峻的公共卫生挑战之一。污水处理厂作为抗生素和ARGs的"集散中心",其生物脱氮(BNR)过程的高微生物密度环境反而可能加速ARGs传播。传统研究多聚焦单一因素影响,难以解析温度、pH、污染物浓度等多因素耦合作用机制,更缺乏预测ARGs动态变化的有效工具。

北京自然科学基金等项目支持的研究团队在《Journal of Environmental Management》发表论文,首次将机器学习(ML)应用于BNR过程中ARGs传播风险的预测。研究收集了15类参数(包括环境因子、污泥特性和微生物群落数据),采用CatBoost、随机森林(RF)、XGBoost和人工神经网络(ANN)四种算法建模,通过特征重要性分析和偏依赖图(PDPs)解析关键驱动因素,最终构建了用户友好的预测平台。

主要技术方法
研究整合了来自不同BNR系统(包括硝化反硝化、部分硝化-厌氧氨氧化PNA等)的监测数据,涵盖pH(6.7-9.0)、温度(15-35°C)、溶解氧(DO)、污染物浓度(如三氯生TCS 0.5mg/L)等参数。通过Spearman相关性分析筛选特征变量后,采用SHAP值评估模型特征重要性,并基于Python开发交互式预测界面。

研究结果

  1. 模型性能比较
    CatBoost对ARGs丰度变化的预测精度最高(R2=0.843),而RF在预测MGEs丰度变化时表现最优(R2=0.708)。模型验证表明ML能有效捕捉ARGs与多因素的复杂非线性关系。

  2. 关键特征解析
    特征重要性分析显示:

  • MGEs丰度变化是预测ARGs的最重要特征,证实水平基因转移(HGT)的主导作用
  • 变形菌门(Proteobacteria)和拟杆菌门(Bacteroidetes)的丰度变化与ARGs传播显著相关
  • 环境因子中污染物浓度和暴露时间对ARGs/MGEs均有显著影响
  1. 调控策略建议
    偏依赖图(PDPs)分析表明:
  • 将反应时间控制在60-120分钟、DO维持在1.5-2.5mg/L可有效抑制ARGs增殖
  • 当污染物浓度>0.3mg/L时,ARGs丰度呈指数级增长

结论与意义
该研究突破传统实验方法的局限,首次建立ML驱动的ARGs风险预测框架。发现MGEs介导的HGT是BNR系统中ARGs传播的核心途径,而Proteobacteria等特定菌门可作为生物标记物。开发的预测平台为污水处理厂优化运行参数(如控制TCS暴露时间<7天)提供了量化工具,对实现"从源头控制ARGs"的精准环境治理具有重要实践价值。研究同时为其他环境中抗生素耐药性的风险评估提供了可迁移的方法论。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号