综述：知识图谱在药物重定位中的应用：从经典机器学习算法到图神经网络

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年08月11日 来源：Computers in Biology and Medicine 6.3

编辑推荐：

　　这篇综述系统梳理了知识图谱（KG）在药物重定位（Drug Repurposing）中的前沿进展，涵盖传统机器学习（ML）到图神经网络（GNN）的技术演变，重点解析了KG构建方法（如多源数据整合、负样本生成）、预测工具（如KG-Predict、DeepKG）的优劣，并探讨了数据稀疏性、可解释性等挑战，为加速罕见病和复杂疾病治疗策略开发提供了AI驱动的解决方案。

知识图谱在药物重定位中的技术演进

药物重定位（Drug Repurposing）通过挖掘已获批药物的新适应症，显著缩短研发周期并降低成本。知识图谱（KG）因其能整合异构生物医学数据（如药物-靶点-疾病关联），成为该领域的核心工具。

数据来源与图谱构建

公共数据库如DrugBank、ChEMBL提供药物化学属性，DisGeNET整合基因-疾病关联，而Open Targets则融合多组学数据。KG通过语义关联（如“抑制”“激活”）将药物、靶点、表型等节点连接，形成多关系网络。例如，COVID-19研究中，CAS Biomedical KG结合PubChem化合物与SARS-CoV₂基因数据，成功预测巴瑞替尼（Baricitinib）的抗病毒机制。

从传统方法到图神经网络

早期非网络方法依赖手工特征（如分子指纹），而网络方法（如随机游走）受限于均匀边假设。图神经网络（GNN）通过以下突破解决这些问题：

GCN：聚合邻域信息，但需全图训练（如KG-Predict验证阿尔茨海默病药物）；
GraphSAGE：采样邻域实现inductive学习，适用于动态图谱；
CompGCN：融合关系嵌入，处理多类型边（如药物-靶点-通路三元组）。

挑战与创新方向

数据稀疏性可通过少样本学习（FSL）缓解，而负样本构建采用对抗生成网络（GAN）提升质量。工具如TxGNN通过子图解释机制增强可解释性，而RDKG-115的三模态KG嵌入整合了基因组学与临床数据。未来，遵循FAIR原则的开放数据平台和调控感知模型（如RGLDR）将进一步推动临床转化。

应用案例与临床验证

KG-DTI预测的阿尔茨海默病药物经分子对接验证，而GDRnet在COVID-19中排名前15的候选包含已获批药物。这些案例证明KG方法不仅能预测新关联，还能揭示作用通路（如JAK-STAT通路抑制炎症）。

展望

多组学融合、动态KG更新及跨机构协作将是突破罕见病治疗瓶颈的关键。随着可解释AI和临床试验数据的持续整合，KG驱动的药物重定位有望成为精准医疗的基石。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号