基于知识图谱与药物背景数据融合的DDI预测模型KGDB-DDI:提升药物相互作用预测精度与临床用药安全

【字体: 时间:2025年07月26日 来源:Artificial Intelligence in Medicine 6.1

编辑推荐:

  针对现有药物相互作用(DDI)预测方法忽略药物背景数据的问题,新疆大学团队提出融合知识图谱(KG)与药物背景数据的KGDB-DDI模型。通过图注意力网络(GAT)和RoBERTa模型分别提取KG特征与文本特征,设计特征融合模块实现多源数据整合。在DrugBank和KEGG数据集上AUC达0.9952,显著优于KGNN、TIGER等方法,为临床合理用药和药物研发提供新工具。

  

在当今多药联用普及的医疗实践中,药物相互作用(DDI)犹如隐藏的"双刃剑"——既能增强疗效也可能引发致命风险。每年仅美国就因未知DDI导致7.4万例急诊和19.5万例住院,传统临床试验又耗费巨大资源。尽管KGNN、TIGER等基于知识图谱(KG)的方法取得进展,但它们对药物研发背景、作用机制等文本数据的忽视,如同仅用半张地图导航,严重制约预测精度。

新疆大学计算机科学与技术学院的研究团队在《Artificial Intelligence in Medicine》发表的研究中,创新性地提出KGDB-DDI模型。该工作首次将知识图谱与药物背景文本数据深度融合,通过图注意力网络(GAT)提取药物在KG中的拓扑特征,利用微调后的RoBERTa模型挖掘药物背景文本语义信息,设计跨模态特征融合模块实现信息互补。在包含2416种药物的DrugBank数据集上,模型AUC达到惊人的0.9952,较传统方法提升显著。

关键技术包括:1)构建包含药物-靶点-通路等多类型节点的生物异质知识图谱;2)采用GAT算法聚合药物节点的高阶邻域特征;3)基于RoBERTa的文本特征提取;4)设计多层感知机(MLP)的特征融合架构。研究特别选用DrugBank和KEGG两大权威数据集,确保数据的全面性和可靠性。

【知识图谱构建与药物节点特征提取】
通过解析DrugBank V5.1.12获得668177对DDI关系数据,构建包含酶、通路、靶点等多维关系的生物医学KG。采用GAT算法捕捉药物节点与其邻域实体(如CYP3A4酶)的关联特征,有效建模药物代谢路径等关键生物学过程。

【药物背景数据处理与特征提取】
针对药物说明书、研究文献等非结构化文本,使用RoBERTa模型提取语义特征。相比传统文本处理方法,该预训练模型能更好理解"抑制代谢酶"等专业表述的深层含义。

【特征融合与DDI预测】
创新设计的融合模块通过门控机制动态调整KG特征与文本特征的权重。实验表明,该模块使模型对如"Ergotamine抑制CYP3A4酶导致Flutamide代谢降低"等复杂机制的预测准确率提升23.6%。

【案例研究】
选取预测概率最高的5组药物对进行分析,包括已知的Cimetidine与Warfarin相互作用案例。模型成功识别其中4组经文献验证的DDI,证实其临床实用性。

这项研究突破性地将多源异构数据融合应用于DDI预测领域,其0.9952的AUC性能刷新了现有记录。特别值得注意的是,模型对药物背景信息的挖掘能力,使其在预测新药相互作用时具有独特优势。研究者指出,未来可扩展纳入药物基因组学数据,进一步提升个性化用药指导能力。该成果不仅为计算药理学提供新范式,更对降低临床用药风险具有重要实践价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号