利用3D深度学习和体外检测方法,在高级氧化过程中筛选新兴污染物的有毒转化产物

《Water Research》:Screening toxic transformation products of emerging pollutants in advanced oxidation processes with 3D deep learning and in vitro assays

【字体: 时间:2026年02月06日 来源:Water Research 12.4

编辑推荐:

  ToxD4C多模态深度学习框架通过整合三维分子几何、图注意力网络和SE(3)equivariant Transformer,实现31项毒性终点的高效预测,优于传统QSAR模型,并依托JC-1、CCK-8等体外实验验证,为水处理及环境风险评估提供新工具。

  
Fulin Shao | Weiying Li | Zhiwei Liang | Yu Zhou | Dawei Zhang | Yu Chang
同济大学环境科学与工程学院,上海,200092,中华人民共和国

摘要

在水处理过程中以及水生环境中形成的化学污染物及其副产物的快速、精确毒性评估仍然是一个重要的环境挑战,因为传统的定量结构-活性关系(QSAR)模型的预测能力受到其依赖于简化分子描述符的限制。为了解决这个问题,开发了一种新型的多模态深度学习框架ToxD4C,该框架能够同时对31个毒性指标进行分类和回归分析,这些指标涵盖了核受体和酶活性、应激反应测试、致突变性、致癌性、心肺毒性以及与水质管理相关的各种环境毒性。ToxD4C独特地整合了三维分子几何结构、图注意力网络和SE(3)等变分Transformer架构,有效捕捉了复杂的立体化学和电子分子特征。同时,通过对密度泛函理论(DFT)优化后的结构进行迁移学习,对预训练的Uni-Mol模型进行了微调,从而独立生成了具有更高可靠性和泛化能力的标准化毒性预测。这两种方法在验证测试中均优于传统的基于描述符的模型。特征属性分析(SHAP)揭示了预测毒性的关键物理化学因素,而受体对接则为选定的受体介导的毒性指标提供了机制上的解释。将该方法应用于实际水基质中的UV/H?O?高级氧化场景,有效识别出了高风险转化产物,并通过JC-1线粒体膜电位、CCK-8细胞活力和核受体/应激反应报告基因检测进一步验证了其预测的毒性。这些工具被集成在开源的Tox-Agents平台中,使得水处理和环境风险评估能够快速且可解释地进行。

章节摘录

引言

高级氧化过程(AOPs)被广泛用于从水系统中去除新兴的有机污染物;然而,不完全矿化通常会产生一系列转化产物(TPs),这些产物的环境风险在很大程度上尚未得到充分研究(Castellano-Hinojosa等人,2023年;Ferrando-Climent等人,2017年)。最近的大规模化学泄漏事件突显了迫切需要快速、基于机制的筛选,不仅针对母体化学物质,也针对由此产生的转化产物。

ToxD4C框架

在这项工作中,开发了一个多模态、多任务的深度学习框架ToxD4C,用于全面的分子毒性预测。基准数据集包括31个指标——26个分类任务和5个回归任务(He等人,2024年)。关键的是,学习目标是在单个指标层面使用实验真实的标签来定义的。详细的数据集统计信息(样本大小、类别不平衡比例和缺失标签模式)在表S4(分类部分)中报告。

性能评估和消融分析

ToxD4C框架在全面的分子毒性基准测试中表现出竞争性性能,不同的架构变体在不同的任务子集中取得了最佳结果。如性能热图(图2f)所示,整个模型在26个分类任务中的平均AUC达到了0.845,优于已建立的方法,包括ToxScan(0.827)、MolCLR(0.798)和ChemBERTa(0.796)。值得注意的是,该模型在预测某些关键指标方面表现出更高的准确性。

结论

本研究介绍了一个集成的计算框架(ToxD4C),它结合了3D深度学习、增强的采样分子动力学和体外验证,改进了受限于2D表示的传统QSAR方法。提供了一个可选的报告生成工具,用于总结模型输出和用户提供的证据,以实现透明的筛选和优先级排序。通过捕捉对毒性至关重要的微妙立体化学和电子特征,该框架能够...

CRediT作者贡献声明

Fulin Shao:撰写 – 审稿与编辑、撰写 – 原始草稿、可视化、方法学、研究、正式分析、数据管理、概念化。 Weiying Li:撰写 – 原始草稿、项目管理、资金获取、正式分析。 Zhiwei Liang:验证、监督、资源管理、数据管理。 Yu Zhou:可视化、验证、正式分析。 Dawei Zhang:撰写 – 原始草稿、方法学、资金获取、数据管理。 Yu Chang:撰写 – 审稿与...

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

致谢

本研究得到了中国“十四五”期间国家重点研发计划(项目编号2024YFC3810901-03)和中国国家自然科学基金(项目编号52470012)的财政支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号