基于药代动力学引导的多任务学习增强分子基础模型用于药物相似性预测

【字体: 时间:2025年07月16日 来源:Bioinformatics 4.4

编辑推荐:

  本研究针对AI生成分子库快速筛选的挑战,提出ADME-DL框架,通过药代动力学(ADME)多任务学习增强分子表征,解决传统方法忽视PK参数互作的问题。研究构建A→D→M→E序贯训练策略,在21个ADME端点数据上优化分子基础模型(MFMs),使药物相似性分类准确率提升18.2%,为早期药物筛选提供PK-aware新范式。

  

在AI加速药物设计的时代,每小时可生成数千个虚拟分子的技术突破,反而让早期筛选成为瓶颈。传统药物相似性评估依赖Lipinski五规则等结构描述符,却忽略了决定临床成败的关键因素——药代动力学(ADME)参数的复杂互作。更棘手的是,现有深度学习方法将吸收、分布、代谢、排泄视为独立任务,导致预测结果与真实生物过程脱节。首尔国立大学(Seoul National University)联合AIGENDRUG公司的研究团队在《Bioinformatics》发表的研究,通过ADME-DL框架破解了这一难题。

研究采用两步策略:首先通过数据驱动的任务依赖分析,建立符合PK原理的A→D→M→E序贯多任务学习(MTL),在GraphMVP等分子基础模型(MFMs)上预训练21个ADME端点;随后利用生成的PK感知嵌入空间,用MLP分类器区分DrugMAP批准的药物与ZINC/PubChem/ChEMBL负样本集。关键技术包括:基于治疗数据联盟(TDC)的21个ADME端点数据集整合、PCGrad梯度冲突解决算法、以及跨GNN/Transformer的模型无关架构验证。

任务依赖分析揭示PK层级关系

通过全组合MTL实验量化任务改进率(TIR),发现吸收(A)任务能提升分布(D)、代谢(M)、排泄(E)任务性能(TIR>0),但反向训练会降低A任务效果(TIR=-0.04)。这与药理认知高度一致——药物需先吸收才能分布,而肝脏代谢又直接影响排泄效率。这种不对称依赖关系为序贯训练提供了生物学依据。

模型无关的性能提升

在DrugMAP-ZINC数据集上,序贯MTL使GraphMVP的F1-score提升17.6%(0.70→0.85),MAT的AUPRC提高7.3%。特别在难样本DrugMAP-ChEMBL上,ADME-DL的F1(0.347)远超传统指纹方法(0.094)。反向序贯(E→M→D→A)则导致MAT性能下降4.3%,印证了PK流程不可逆性。

临床相关性验证

对华法林(CYP2C9代谢)等5种临床药物分析显示,序贯MTL正确预测酶特异性(AUC=0.85)且药物相似性评分(0.9989)显著高于单任务学习(0.6507)。t-SNE可视化显示,ADME-DL嵌入空间将高生物利用度药物聚类质量(轮廓系数0.20)提升82%。

该研究首次将PK原理转化为可计算的任务依赖图,突破结构描述符的局限性。案例证明其评分能反映药物研发阶段——AI生成分子中位评分(0.01)远低于上市药物(0.96)。这种兼具生物学可解释性与跨模型通用性的框架,为万亿级虚拟库的高通量筛选提供了新标准。未来整合毒性(T)参数可能进一步拓展ADMET预测疆域。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号