综述:药物-靶点相互作用/亲和力预测:深度学习模型与研究进展综述

【字体: 时间:2025年07月03日 来源:Computers in Biology and Medicine 7.0

编辑推荐:

  这篇综述系统梳理了2016-2025年间180种基于深度学习(DL)和图神经网络(GNN)的药物-靶点相互作用/亲和力(DTI/DTA)预测方法,创新性地按输入表征将模型分为序列、结构、复合型等五类,为加速药物发现提供了架构设计与可解释性研究的关键洞见。

  

药物靶点预测的深度学习革命

Abstract
药物研发是耗时耗资的过程,从靶点结构识别到FDA审批需12-15年,平均耗资18亿美元。传统方法难以捕捉药物-靶点间复杂关系,而深度学习模型通过精确的端到端学习,显著提升了相互作用预测效率。本文系统分析180种DTI/DTA预测模型,为开发更有效药物提供方法论支持。

Introduction
药物开发涉及靶点鉴定、先导化合物优化、临床前/临床试验等阶段,仅万分之一的候选分子能最终上市。药物靶点特异性(DTI)和结合强度(DTA)是核心问题,多药理学现象和药物重定位(Drug repositioning)策略凸显了精准预测的重要性。经典实验方法成本高昂,促使机器学习(ML)和人工智能(AI)成为DTI/DTA预测的新范式。

Input representations
输入表征分为蛋白质和药物两大维度:

  • 序列数据:SMILES字符串表示药物分子,氨基酸序列描述蛋白质
  • 结构数据:3D晶体结构(如PDB数据库)或分子对接构象
  • 复合型数据:融合序列与结构特征,如AlphaFold2预测的蛋白折叠
  • 效用网络:整合药物副作用数据库(SIDER)、人类蛋白质互作网络(HPRD)等

Overview of DTI/DTA prediction methods
模型可分为三类主线:

  1. 序列基模型:如DeepDTA使用CNN处理氨基酸序列和SMILES
  2. 结构基模型:GNN-DTI利用图神经网络解析分子拓扑结构
  3. 复合型模型:MATT-DTI结合Transformer与3D卷积

两类衍生方向:

  • 复合物基模型:分析药物-靶点共结晶结构(如PDBbind数据集)
  • 效用网络模型:整合多组学数据的异构网络(如STITCH数据库)

Databases
关键数据集包括:

  • 亲和力数据:Davis(激酶抑制常数)、KIBA(整合多源数据)
  • 相互作用数据:BindingDB(实验验证互作)、DUD-E(虚拟筛选基准)
  • 生物网络:CTD(化合物-疾病关联)、ToxCast(毒性效应)

Discussion
现存挑战包括模型可解释性不足、阴性样本构建困难等。未来方向建议:

  • 开发混合架构(如GNN+Transformer)
  • 引入迁移学习应对小样本场景
  • 建立标准化评估协议(尤其对临床前数据)

Authorship
由Ali Vefghi领衔的研究团队,通过系统分类与性能对比,为领域研究者绘制了技术路线图。该综述特别强调输入表征与模型架构的协同创新,为精准医疗时代的药物研发提供了AI驱动的解决方案。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号