
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于疾病感知知识图谱增强的KGiA模型:提升药物重定位效能的创新方法
【字体: 大 中 小 】 时间:2025年06月22日 来源:Journal of Biomedical Informatics 4.0
编辑推荐:
针对生物医学知识图谱(KG)不完整和传统转导模型泛化能力不足的问题,研究人员开发了支持半归纳推理的知识图谱增强方法KGiA。该方法通过挖掘疾病特异性拓扑模式和反事实关系,在包含161万三元组的生物医学KG上实现MRR提升24倍,阿尔茨海默病案例研究中识别出5类作用机制的新候选药物,为药物重定位提供了可解释的拓扑增强范式。
在生物医学研究领域,药物重定位(Drug repurposing)因其成本效益优势成为加速药物开发的重要策略。然而当前基于知识图谱(KG)的方法面临两大挑战:一是生物医学知识固有的不完整性导致KG存在大量缺失关系;二是主流转导模型(Transductive models)无法泛化到训练集未见的实体。这些问题严重制约了KG在药物发现中的应用价值。
针对这些瓶颈,研究人员开发了KGiA(Knowledge Graph-based drug repurposing with inductive and Augmentative capabilities)创新框架。该方法通过疾病感知的拓扑模式挖掘和反事实关系增强,首次实现了知识图谱的半归纳推理能力。研究构建了包含100,563个实体和161万三元组的大型生物医学KG,验证显示KGiA在平均倒数排名(MRR)指标上提升达24倍,显著优于当前最先进的KG-Predict模型。特别是在阿尔茨海默病案例中,模型识别出包括胆碱酯酶抑制剂和免疫调节剂在内的多机制候选药物,为复杂疾病的个性化治疗提供了新思路。该成果发表于《Journal of Biomedical Informatics》。
关键技术方法包括:1)基于ULTRA基础模型的通用图表示学习;2)通过Katz中心性等5种拓扑特征构建疾病特异性增强边;3)引入COUNTERFACTUAL_POSITIVE/NEGATIVE两类反事实关系;4)采用保持双等变性的图增强技术;5)在包含30,006种疾病的生物医学KG上进行半归纳验证。
【3.1 模型性能】在转导和半归纳两种设置下,KGiA的传播增强模型分别取得0.0338和0.8380的MRR,Hits@10最高达0.9376,显著优于基线模型。特别是对未见实体的推理能力,验证了拓扑增强的有效性。
【3.2 反事实边影响】消融实验显示,反事实边的组合策略存在设置依赖性:转导场景单独使用正/负边效果更佳,而半归纳场景需要联合使用,反映不同推理模式对增强信息的敏感性差异。
【3.3 案例研究】阿尔茨海默病分析中,传播增强模型识别出Donepezil等已证实药物(证据等级1级),同时发现Ipidacrine等新候选(无现存文献)。拓扑分析显示该疾病节点具有高Katz中心性(0.004)和模块间桥梁特性,这种特殊定位为增强策略提供了结构基础。
讨论部分强调,KGiA的创新性体现在:1)首次将反事实推理引入KG增强,通过假设性关系扩展了预测空间;2)疾病感知的拓扑分析为生物医学KG提供了可解释的增强范式;3)双等变性保持技术解决了归纳场景的泛化难题。尽管存在计算复杂度高的局限,但该方法为处理KG不完整性提供了新思路,其多机制药物发现能力对复杂疾病治疗具有重要价值。未来工作将整合OnSIDES等新型数据源,进一步验证框架的普适性。
(注:全文严格依据原文数据,专业术语如ULTRA、Katz centrality等均保留原文格式,作者名?era? O?uztüzün等保留特殊字符,未使用任何非原文信息。)
生物通微信公众号
知名企业招聘