Fate-tox:用于 E (3) 等变多器官毒性预测的片段注意力 Transformer 框架 —— 多视角深度学习助力药物开发中的毒性评估

【字体: 时间:2025年05月15日 来源:Journal of Cheminformatics 7.1

编辑推荐:

  推荐 现有计算预测模型多聚焦单器官毒性,而药物开发中多器官毒性预测至关重要却具挑战。研究人员开发 FATE-Tox 框架,结合多片段图、2D/3D 分子表征及注意力 Transformer。其在多数据集上性能优于基线,且具可解释性,为药物安全评估提供新工具。

  

论文解读


在药物研发的漫长征程中,毒性评估始终是一道难以逾越的关卡,无数颇具潜力的化合物因毒性问题折戟于研发后期。当前,大多数计算模型仅聚焦于单一器官的毒性预测,然而人体是一个复杂的有机整体,各器官通过精密的生化和生理通路相互关联。就像罗非昔布(rofecoxib),最初着眼于胃肠道安全性研发,却因引发心血管风险而退市,这深刻体现了单器官毒性模型的局限性 —— 无法捕捉器官系统间的关联及次级毒性效应,难以应对药物全身毒性评估的需求。在此背景下,韩国首尔国立大学(Seoul National University)的研究团队开展了一项极具意义的研究,相关成果发表在《Journal of Cheminformatics》上,为多器官毒性预测提供了全新的解决思路。

为攻克多器官毒性预测的难题,研究人员开发了 FATE-Tox(Fragment Attention Transformer for E (3)-Equivariant Toxicity Prediction)框架。该框架整合了结构建模与解释能力,旨在实现对多器官毒性的全面、精准且可解释的预测。

研究采用了多项关键技术方法。首先,运用三种碎片化方法(BRICS、Bemis-Murcko 支架、RDKit 官能团)将分子拆解为不同层次的子结构,构建片段级图,以捕捉多样的亚结构特征。其次,结合 2D 拓扑和 3D 空间信息的多视角分子表征,通过分子 Transformer 模块和 E (3) 等变图神经网络(EGNN)处理,其中 E (3) 等变性确保模型在分子三维空间变换(平移、旋转、反射)下预测结果的一致性。此外,采用多任务学习(MTL)结合梯度手术(PCGrad)方法,缓解任务间梯度冲突,提升模型性能。实验数据来源于 MoleculeNet 和 TDC 等基准数据集,涵盖多种器官毒性和全身毒性终点。

预测性能评估


在七个毒性基准数据集(如 BBBP、DILI、SIDER 等)上,FATE-Tox 的单任务学习(STL)和多任务学习(MTL)性能均显著优于传统机器学习模型(随机森林 RF、支持向量机 SVM 等)和现有深度学习模型(MolCLR、GraphMVP 等)。例如,在 BBBP 任务中,FATE-Tox STL 的 AUROC 达 70.15%,MTL 进一步提升至 71.16%;在 DILI 任务中,MTL 的 AUROC 为 91.86%,展现出其在多器官毒性预测中的有效性。

碎片化方法的贡献


不同碎片化方法在各数据集的权重差异显著,反映了不同毒性机制的化学特征。BRICS 碎片化在 BBBP 任务中权重最高(0.4),因其能保留分子整体理化性质(如分子量、亲脂性),这对血脑屏障穿透性预测至关重要;RDKit 官能团碎片化在致癌性(Carcinogens)和肝毒性(DILI)任务中权重较高(均为 0.4),因其可提取硝基、醌类等毒性官能团;Bemis-Murcko 支架在皮肤反应(Skin Rxn)任务中权重达 0.5,凸显了核心分子骨架对皮肤毒性的影响。多种碎片化方法的整合显著提升了模型的泛化能力。

模型可解释性与嵌入空间分析


通过注意力可视化,FATE-Tox 能识别与文献一致的 3D 毒性基团。以沙利度胺(thalidomide)对映体为例,其 2D 结构相同,但 3D 空间构型差异显著,FATE-Tox 的多视角嵌入空间可有效区分 (R)- 和 (S)- 沙利度胺,而仅用 2D 表征的模型(如 MAT)则无法做到。多任务学习的嵌入空间通过 t-SNE 可视化和轮廓系数分析,显示出更优的类间分离性,表明其能捕捉跨任务的通用特征和任务特异性模式。

案例研究


在血脑屏障穿透性案例中,FATE-Tox 通过注意力系数识别出抗组胺药和 β 受体阻滞剂的关键亚结构。如苯海拉明(diphenhydramine)的疏水性苯环使其易穿透血脑屏障,而西替利嗪(cetirizine)的羧基和氯离子取代基增加极性,降低穿透能力。在致癌性案例中,苏丹红 I(Sudan I)的偶氮基(-N=N-R)和磺酸基团被高注意力系数标记,与已知致癌机制一致,验证了模型的可解释性。

结论与意义


FATE-Tox 通过双分支架构整合原子级和片段级特征,结合 Transformer 和 E (3) 等变图神经网络,成功应对了多器官毒性预测的三大挑战:亚结构变异性、分子表征能力和可解释性。其在多任务学习中的优异表现及可解释性,为科学家和临床医生提供了更透明、更具临床意义的全身毒性评估工具,有望减少药物研发后期因毒性导致的失败,推动更安全、更高效的药物开发进程。未来,若能进一步探索自适应碎片化策略和时间依赖性毒性模式,该框架有望在计算毒理学领域发挥更广泛的作用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号