基于分子优化增强图神经网络的药物性肝损伤预测模型DILIGeNN的构建与验证

【字体: 时间:2025年08月19日 来源:Journal of Cheminformatics 5.7

编辑推荐:

  本研究针对药物性肝损伤(DILI)预测的临床挑战,创新性地开发了DILIGeNN模型。研究人员通过分子优化技术构建包含空间构象与静电特征的3D分子图数据集,结合图神经网络(GNN)架构优化策略,在FDA DILI数据集上实现0.897的AUC值,显著超越现有方法。该研究为早期药物研发提供了高精度的肝毒性预测工具,相关技术路线在Clintox(0.918 AUC)、BBBP(0.993 AUC)等分子属性预测任务中展现出卓越的泛化能力。

  

药物开发过程中,药物性肝损伤(DILI)是导致临床试验终止和药品退市的首要原因。据统计,约50%的急性肝衰竭病例与1000多种FDA批准药物相关。然而现有预测模型面临两大困境:传统机器学习依赖人工特征工程,而深度学习方法多局限于2D分子表示。更棘手的是,动物模型与人体反应的差异使临床前毒性评估准确率不足50%,亟需发展更精准的计算机预测方法。

英国帝国理工学院生物信息学部的研究团队在《Journal of Cheminformatics》发表突破性研究,开发了DILIGeNN预测系统。该系统首次将3D分子优化特征(键长、Gasteiger电荷等)整合进图神经网络,通过嵌套交叉验证框架和序列热启动训练策略,在多项分子属性预测任务中刷新性能记录。研究证实,仅使用单一分子图输入的GraphSAGE架构即可超越需要多模态输入的现有最佳模型。

关键技术包括:1)基于MMFF力场的3D分子构象优化;2)构建含12种原子特征和键长等边缘特征的自定义图数据集;3)采用四层嵌套交叉验证(含超参数优化、模型重初始化、序列热启动三阶段);4)对比测试GCN、GAT、GraphSAGE和GIN四种GNN架构。研究使用FDA最新DILIst数据集(1167种药物)及MoleculeNet基准数据集验证性能。

【数据预处理】

建立严格的分子标准化流程,筛选含10种常见元素的有机药物分子,通过互变异构体枚举确保结构一致性。优化后的3D构象使键长变化标准差从0.62%降至0.53%,为后续建模提供高质量输入。

【模型性能】

在DILI预测任务中,GraphSAGE表现最优(测试AUC 0.897±0.043),较现有最佳模型DNN-GATNN提升18.5%。特征对比实验显示,自定义3D特征使GraphSAGE在BBBP预测的AUC从0.871跃升至0.993,验证空间特征的关键作用。

【机制分析】

GAT模型在注意力机制中有效捕获原子间静电相互作用,而GIN通过MLP学习拓扑等价性。序列热启动训练使模型验证AUC平均提升0.132,证明渐进式参数微调的有效性。

该研究开创性地将计算化学与图神经网络相结合,其技术路线具有三重意义:首先,DILIGeNN仅需SMILES字符串输入即可实现精准预测,大幅降低数据获取门槛;其次,嵌套验证框架确保模型稳健性,避免现有研究因数据划分导致的性能虚高;最重要的是,该方法在DILI之外的多项分子属性预测中展现普适性,为AI辅助药物设计提供了通用技术平台。未来通过整合可解释性分析,有望揭示致毒分子亚结构,指导更安全的药物分子设计。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号