
-
生物通官微
陪你抓住生命科技
跳动的脉搏
DeepDTAGen:基于多任务深度学习的药物-靶标亲和力预测与靶向药物生成一体化框架
【字体: 大 中 小 】 时间:2025年05月31日 来源:Nature Communications 14.7
编辑推荐:
为解决药物发现中预测与生成任务割裂的难题,中国研究团队开发了多任务学习框架DeepDTAGen,通过共享特征空间同步实现药物-靶标结合亲和力(DTA)预测和靶向药物生成。该研究创新性提出FetterGrad算法解决梯度冲突问题,在KIBA等三大数据集上验证显示,其DTA预测指标CI值达0.897,生成药物有效性达99.9%,为加速药物研发提供智能化解决方案。
药物研发领域长期面临两大核心挑战:准确预测药物与靶标蛋白的结合强度,以及高效生成具有特定靶向性的新药分子。传统机器学习方法往往将这两个任务割裂处理,忽略了它们内在的生物学关联,导致预测准确性受限且生成药物缺乏靶向特异性。更棘手的是,现有模型难以同时捕捉药物分子结构特征和蛋白质构象动态,而多任务学习中的梯度冲突问题进一步制约了模型性能。这些瓶颈使得药物开发仍高度依赖耗时费力的实验筛选,亟需创新性计算框架突破现有技术局限。
中国中南大学的研究团队在《Nature Communications》发表了题为"DeepDTAGen: a multitask deep learning framework for drug-target affinity prediction and target-aware drugs generation"的研究论文,提出首个能同步完成药物-靶标亲和力预测和靶向药物生成的多任务深度学习框架。该研究通过共享特征空间整合两类任务,并开发FetterGrad算法解决优化难题,最终在预测准确性和药物生成质量上实现双重突破。
研究采用三大关键技术:1)基于门控卷积神经网络(Gated-CNN)的蛋白质特征提取,通过门控机制筛选关键氨基酸序列特征;2)融合原子级特征的图编码器,将药物SMILES转化为包含环结构、杂化方式等21种原子特征的图数据;3)条件Transformer解码器,以亲和力值和蛋白质特征为条件生成靶向药物。实验数据来自KIBA、Davis和BindingDB三大基准数据集,涵盖超过18万组药物-靶标相互作用。
【预测性能】在KIBA数据集上,DeepDTAGen的 concordance index(CI)达0.897,较传统模型KronRLS提升14.7%,MSE降低34.2%。特别在药物选择性测试中,模型准确预测了3-[3-[2-[4-(4-乙基哌嗪-1-基)苯胺基]嘧啶-4-基]咪唑并[1,2-a]吡啶-2-基]-N-(2-氟苯基)苯甲酰胺等药物对Q9HAZ1、P43405等靶标的不同亲和力水平,方差仅0.04-0.07。
【生成能力】通过"On SMILES"和"随机生成"两种策略,模型生成药物的化学有效性达99.9%。对表皮生长因子受体(EGFR)生成的药物分子,AutoDock VINA验证其结合能达-8.81 kcal/mol,且与UniProt记录的活性口袋高度吻合。多药理学分析显示,生成药物能保持对PAK4_HUMAN等3个以上靶标的polypharmacological效应。
【机制验证】消融实验证实,移除图卷积层(GCL)会使r2m下降11.35%,而FetterGrad算法使多任务损失收敛速度提升2倍。关键创新在于:1)通过PMVO/AMVO双路特征分离实现预测与生成任务协同;2)计算梯度欧氏相似度(ESS)<0.5时触发梯度校正,解决87.6%的冲突情况。
该研究的重要意义在于:首次建立药物发现"预测-生成"闭环系统,DeepDTAGen生成的药物中72.3%符合Lipinski五规则,合成可及性评分(SAS)平均2.721,显著优于传统生成模型。局限性在于尚未整合立体化学信息,未来可通过引入手性原子特征进一步提升生成质量。这项工作为人工智能驱动的药物设计提供了可扩展的框架,已在抗肿瘤激酶抑制剂开发中展现应用潜力。
生物通微信公众号
知名企业招聘