综述:从矩阵分解到图神经网络:计算药物重定位的进展

【字体: 时间:2025年10月11日 来源:Drug Discovery Today 7.5

编辑推荐:

  本综述系统梳理了人工智能(AI)驱动的药物重定位策略,涵盖从经典矩阵分解(MF)到图神经网络(GNN)、Transformer等前沿模型。文章重点探讨了其在肿瘤、感染、神经、自身免疫及罕见病等领域的应用,并剖析了数据异质性、模型可解释性及早期ADME-Tox(吸收、分布、代谢、排泄和毒性)整合等关键挑战,展望了多组学整合、基础模型和生成式AI等未来方向,为利用计算方法推动转化药物发现提供了深刻见解。

  
Abstract
药物重定位(Drug Repositioning)旨在为现有药物探索新的治疗用途,是传统药物发现的一种经济有效的替代方案。人工智能(AI)和计算生物学的进步通过分析大规模生物医学数据加速了这一过程。本综述总结了AI驱动的策略,范围从经典的矩阵分解(Matrix Factorization)到图神经网络(Graph Neural Networks, GNNs)和Transformer等先进模型。其在肿瘤学、传染病、神经系统疾病、自身免疫病和罕见病中的应用得到了计算机(in silico)预测和真实世界验证的支持。讨论的关键挑战包括数据异质性、模型可解释性,以及为减少后期失败而亟需早期整合ADME–Tox(吸收、分布、代谢、排泄和毒性)和安全性评估。未来方向强调了多组学整合、基础模型(Foundation Models)和生成式AI(Generative AI)。本文为利用计算方法进行转化药物发现提供了见解,并强调了AI在治疗创新中的作用。
Introduction
新药开发过程以其昂贵、耗时且充满不确定性而闻名。平均而言,将一种新药推向市场需要超过十年时间和超过26亿美元的成本,从临床前阶段到获得监管批准的几率低于10%[1], [2], [3], [4]。这些挑战推动了人们对药物重定位(也称为药物再利用)日益增长的兴趣,该策略旨在为已获批或已针对其他适应症进入临床试验阶段的现有药物确定新的治疗用途。药物重定位具有诸多优势,包括缩短开发时间、降低成本和改善安全性,因为被重定位的药物已经过毒性、药代动力学和副作用测试[5], [6]
药物重定位的科学原理在于对疾病机制认识的不断深化,以及药物与多个分子靶点复杂相互作用的理解。许多疾病共享共同的生物学通路、分子特征或遗传成分,这使得跨疾病治疗干预成为可能。这一概念已被著名的重定位药物所例证,如西地那非(最初开发用于心绞痛,后用于治疗勃起功能障碍和肺动脉高压)和沙利度胺(从治疗孕吐到多发性骨髓瘤)[7], [8]
近年来,计算生物学、人工智能(AI,包括机器学习ML和深度学习DL在内的广泛领域)的进步,以及大规模生物医学数据的可用性,已将药物重定位转变为一个数据驱动、算法指导的过程[9], [10]。随着组学数据集、分子相互作用网络、电子健康记录(EHRs)和生物医学文献的快速积累,研究人员开发了多种计算方法来预测潜在的药物-疾病关联[11], [12], [13]。早期方法包括特征匹配、基于网络的推理和矩阵分解技术[14], [15], [16]。最近,深度学习模型(利用多层神经网络作为AI的一个强大子集)通过从高维和多模态数据中学习,被应用于捕捉复杂的药物-疾病关系[17], [18]。其中,图神经网络(GNNs)和Transformer因其能够对具有丰富关系信息的异质生物医学网络进行建模而显示出特殊前景[19], [20]
本综述旨在对计算药物重定位的领域进行全面且结构化的概述。首先概述作为计算方法基础的关键数据库。接着系统介绍传统和现代方法,包括基于特征的方法、基于图的方法、基于生成式AI的方法以及其他DL相关方法。然后通过主要疾病领域(如肿瘤、传染病、神经系统疾病和罕见病)的代表性案例研究阐述计算方法的实际应用。此外,讨论阻碍计算发现向临床转化的关键挑战,包括数据异质性、模型可解释性和实验验证的稀缺性。最后,探索该领域的未来方向,强调多组学整合和大规模预训练基础模型(一种能够进行零样本和少样本学习的强大DL类型)等新兴技术的潜力。通过对方法、应用和挑战进行最新综述,旨在指导研究人员、数据科学家和临床医生驾驭快速发展的计算药物重定位领域。
Key databases for drug repositioning
强大的数据基础设施对于有效的药物重定位至关重要,因为它支持整合和分析多样化的生物医学数据集。目前已开发了许多专门的数据库来支持这一过程,每个数据库提供独特的数据类型,如药物-靶点相互作用、基因表达谱、临床适应症、不良反应和药物基因组学关联。这些资源在内容深度、覆盖范围和可访问性方面各不相同。
Evolution of computational methods for drug repositioning
药物重定位的方法已从传统的基于相似性的技术发展到复杂的AI和基于网络的算法。本节根据底层数据类型和方法学进展,全面概述这些计算方法,主要分类包括基于特征的方法、基于图的方法、基于生成式AI的方法以及其他DL方法。利用这些计算方法,药物重定位过程遵循一个四阶段流程。
Applications and case studies across disease domains
计算药物重定位已成功应用于广泛的疾病领域,证明了其在常见病和罕见病中的转化影响。本节重点介绍在肿瘤学、传染病、神经系统疾病、自身免疫病和罕见病中的代表性应用。通过案例研究说明这些计算预测如何得到验证,并取得重要的临床前或临床成功。
Challenges and future perspectives
尽管计算药物重定位取得了显著进展,但一些关键挑战仍然存在,限制了其临床转化。虽然计算方法提供了巨大潜力,但数据异质性、可解释性和验证成本等问题在像GNNs这样的复杂网络架构中尤为突出。GNNs的高性能通常依赖于高质量、大规模的异质生物医学图,但这些数据集常常存在不一致和偏差。此外,这些模型的“黑箱”性质使得理解预测背后的生物学机制变得困难,这对获得临床医生和监管机构的信任构成了障碍。另一个主要障碍是实验验证的高成本和复杂性,这常常阻碍有前景的计算预测进入临床前和临床测试。未来的工作需要侧重于开发更可解释的AI模型,建立标准化和高质量的数据集,并将早期ADME-Tox和安全性分析整合到计算工作流程中,以提高预测的可靠性和临床相关性。多组学整合、基础模型和生成式AI等新兴技术有望通过实现更全面和准确的预测来应对这些挑战。
Concluding remarks
本综述总结了用于药物重定位的AI驱动计算方法的演变和应用,这是一种极具前景的加速治疗发现的方法。我们提出了该过程的综合流程,从数据表示到模型应用。我们涵盖了广泛的计算策略,从经典的矩阵分解技术(如NMF和NMTF)到更复杂的基于深度学习的方法,如DNNs、CNNs、RNNs和VAEs。特别强调了GNNs和Transformer在建模复杂生物医学网络方面的强大能力。这些方法在从肿瘤学到罕见病等多种疾病中发现了新的药物-疾病关联,其中许多已通过实验或临床数据得到验证。尽管取得了这些成功,该领域仍面临数据异质性、模型可解释性以及将计算预测转化为实际治疗结果的挑战。未来的进展有赖于多组学数据的整合、可解释AI的发展以及基础模型和生成式AI的应用。通过应对这些挑战并利用新兴技术,计算药物重定位有望显著加速药物开发进程,并将现有疗法更有效地应用于新的医疗需求。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号