
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于氮杂环结构-毒性依赖机制的卡马西平转化产物EC50毒性预测模型研究
【字体: 大 中 小 】 时间:2025年09月06日 来源:Journal of Hazardous Materials Advances 7.7
编辑推荐:
为解决卡马西平(CBZ)转化产物(TPs)毒性数据匮乏问题,研究人员通过机器学习构建了基于氮杂环结构(NHCs)的EC50毒性预测模型。采用变分自编码器(VAE)数据增强技术,建立支持向量回归(SVR)和梯度提升机(GBM)最优模型,SHAP分析揭示氮杂环结构、拓扑特性等关键毒性贡献因子,为环境监测和生态风险评估提供可靠工具。
卡马西平(CBZ)作为典型氮杂环化合物(NHCs),其转化产物(TPs)在水环境中频繁检出,与微生物抗生素耐药性等全球健康风险密切相关。然而,TPs结构复杂且不稳定,传统合成方法难以制备,导致毒性数据严重匮乏。更棘手的是,目前缺乏针对CBZ-TPs的毒性预测工具,这极大阻碍了环境风险评估。面对这一挑战,暨南大学环境与气候学院团队在《Journal of Hazardous Materials Advances》发表创新研究,通过机器学习破解TPs毒性预测难题。
研究团队首先通过实验测定49种NHCs和CBZ-TPs对费氏弧菌(Vibrio fischeri)的EC50值,构建高质量毒性数据集。为解决小样本过拟合问题,采用变分自编码器(VAE)将训练集从38个样本扩增至200个。基于分子描述符(MDs)筛选,开发了8种回归模型和6种分类模型,并通过SHAP分析揭示关键毒性贡献因子。
回归建模与数据增强
研究显示,支持向量回归(SVR)在增强后的数据集表现最优,测试集R2达0.831,外部验证集R2为0.796。关键分子描述符Eig08_EA(bo)和AVS_H2等被鉴定为重要毒性贡献因子,反映电子结构和疏水性特征对毒性的影响。
结构贡献解析
SHAP分析将关键MDs归为ETA指数和2D矩阵描述符等7类,其中70%与氮杂环特性相关。研究揭示CBZ-TPs毒性机制源于三大结构特征:杂环刚性增强受体结合能力、拓扑结构影响膜亲和性、氮原子电子效应介导氧化损伤。
分类模型评估
梯度提升机(GBM)在分类任务中表现突出,外部验证准确率达100%。模型可精准区分高低毒性化合物(EC50阈值1mg/L),为环境监管提供高效筛查工具。
这项研究创新性地建立了氮杂环结构-毒性依赖机制,开发的预测模型不仅填补了CBZ-TPs毒性评估工具空白,其VAE增强策略更为小样本毒理学研究提供新范式。通过SHAP分析揭示的结构贡献规律,为定向降解高毒性TPs提供了分子设计靶点,对保障水环境安全和公共卫生具有重要意义。
生物通微信公众号
知名企业招聘