综述:知识图谱在药物重定位中的应用:从经典机器学习算法到图神经网络

【字体: 时间:2025年08月11日 来源:Computers in Biology and Medicine 6.3

编辑推荐:

  这篇综述系统梳理了知识图谱(KG)在药物重定位(Drug Repurposing)中的前沿进展,涵盖传统机器学习(ML)到图神经网络(GNN)的技术演变,重点解析了KG构建方法(如多源数据整合、负样本生成)、预测工具(如KG-Predict、DeepKG)的优劣,并探讨了数据稀疏性、可解释性等挑战,为加速罕见病和复杂疾病治疗策略开发提供了AI驱动的解决方案。

  

知识图谱在药物重定位中的技术演进

药物重定位(Drug Repurposing)通过挖掘已获批药物的新适应症,显著缩短研发周期并降低成本。知识图谱(KG)因其能整合异构生物医学数据(如药物-靶点-疾病关联),成为该领域的核心工具。

数据来源与图谱构建

公共数据库如DrugBank、ChEMBL提供药物化学属性,DisGeNET整合基因-疾病关联,而Open Targets则融合多组学数据。KG通过语义关联(如“抑制”“激活”)将药物、靶点、表型等节点连接,形成多关系网络。例如,COVID-19研究中,CAS Biomedical KG结合PubChem化合物与SARS-CoV2基因数据,成功预测巴瑞替尼(Baricitinib)的抗病毒机制。

从传统方法到图神经网络

早期非网络方法依赖手工特征(如分子指纹),而网络方法(如随机游走)受限于均匀边假设。图神经网络(GNN)通过以下突破解决这些问题:

  • GCN:聚合邻域信息,但需全图训练(如KG-Predict验证阿尔茨海默病药物);

  • GraphSAGE:采样邻域实现inductive学习,适用于动态图谱;

  • CompGCN:融合关系嵌入,处理多类型边(如药物-靶点-通路三元组)。

挑战与创新方向

数据稀疏性可通过少样本学习(FSL)缓解,而负样本构建采用对抗生成网络(GAN)提升质量。工具如TxGNN通过子图解释机制增强可解释性,而RDKG-115的三模态KG嵌入整合了基因组学与临床数据。未来,遵循FAIR原则的开放数据平台和调控感知模型(如RGLDR)将进一步推动临床转化。

应用案例与临床验证

KG-DTI预测的阿尔茨海默病药物经分子对接验证,而GDRnet在COVID-19中排名前15的候选包含已获批药物。这些案例证明KG方法不仅能预测新关联,还能揭示作用通路(如JAK-STAT通路抑制炎症)。

展望

多组学融合、动态KG更新及跨机构协作将是突破罕见病治疗瓶颈的关键。随着可解释AI和临床试验数据的持续整合,KG驱动的药物重定位有望成为精准医疗的基石。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号