
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:知识图谱在药物重定位中的应用:从经典机器学习算法到图神经网络
【字体: 大 中 小 】 时间:2025年08月11日 来源:Computers in Biology and Medicine 6.3
编辑推荐:
这篇综述系统梳理了知识图谱(KG)在药物重定位(Drug Repurposing)中的前沿进展,涵盖传统机器学习(ML)到图神经网络(GNN)的技术演变,重点解析了KG构建方法(如多源数据整合、负样本生成)、预测工具(如KG-Predict、DeepKG)的优劣,并探讨了数据稀疏性、可解释性等挑战,为加速罕见病和复杂疾病治疗策略开发提供了AI驱动的解决方案。
药物重定位(Drug Repurposing)通过挖掘已获批药物的新适应症,显著缩短研发周期并降低成本。知识图谱(KG)因其能整合异构生物医学数据(如药物-靶点-疾病关联),成为该领域的核心工具。
公共数据库如DrugBank、ChEMBL提供药物化学属性,DisGeNET整合基因-疾病关联,而Open Targets则融合多组学数据。KG通过语义关联(如“抑制”“激活”)将药物、靶点、表型等节点连接,形成多关系网络。例如,COVID-19研究中,CAS Biomedical KG结合PubChem化合物与SARS-CoV2基因数据,成功预测巴瑞替尼(Baricitinib)的抗病毒机制。
早期非网络方法依赖手工特征(如分子指纹),而网络方法(如随机游走)受限于均匀边假设。图神经网络(GNN)通过以下突破解决这些问题:
GCN:聚合邻域信息,但需全图训练(如KG-Predict验证阿尔茨海默病药物);
GraphSAGE:采样邻域实现inductive学习,适用于动态图谱;
CompGCN:融合关系嵌入,处理多类型边(如药物-靶点-通路三元组)。
数据稀疏性可通过少样本学习(FSL)缓解,而负样本构建采用对抗生成网络(GAN)提升质量。工具如TxGNN通过子图解释机制增强可解释性,而RDKG-115的三模态KG嵌入整合了基因组学与临床数据。未来,遵循FAIR原则的开放数据平台和调控感知模型(如RGLDR)将进一步推动临床转化。
KG-DTI预测的阿尔茨海默病药物经分子对接验证,而GDRnet在COVID-19中排名前15的候选包含已获批药物。这些案例证明KG方法不仅能预测新关联,还能揭示作用通路(如JAK-STAT通路抑制炎症)。
多组学融合、动态KG更新及跨机构协作将是突破罕见病治疗瓶颈的关键。随着可解释AI和临床试验数据的持续整合,KG驱动的药物重定位有望成为精准医疗的基石。
生物通微信公众号
知名企业招聘