KA-DDI:一种基于知识适应的对比学习框架,用于预测药物之间的相互作用

《Expert Systems with Applications》:KA-DDI: A Knowledge-Adaptive Contrastive Learning Framework for Drug-Drug Interaction Prediction

【字体: 时间:2026年01月07日 来源:Expert Systems with Applications 7.5

编辑推荐:

  精准预测药物-药物相互作用(DDI)对保障用药安全至关重要。本文提出KA-DDI知识自适应框架,通过双图自适应对比学习模块和任务驱动型图增强策略,有效解决知识图谱中的知识过载与交互主导问题,同时整合分子结构特征与SMILES序列模式,结合多任务学习提升模型鲁棒性。实验表明KA-DDI在DrugBank和KEGG数据集上显著优于基线方法。

  
余丽|刘家明|李月超|尤海茹|尤珠红|袁阳|米成刚
中国陕西省西安市西北工业大学,710129

摘要

准确预测药物相互作用(DDIs)对于确保药物安全至关重要。虽然利用知识图谱(KGs)的方法显示出潜力,但它们面临着两个根本性挑战:知识过载,即生物医学KGs中的噪声连接会掩盖关键信息;以及交互作用主导性,模型过度拟合观察到的DDI链接,忽略了更全面的语义知识。为了克服这些挑战,我们提出了KA-DDI,这是一种新型的知识自适应对比学习框架。其核心创新在于双图自适应对比学习模块中的关系感知采样策略。该策略动态优化图结构,以抑制与任务无关的连接并强调药理学相关的关系。KA-DDI首先通过多模态融合模块整合药物分子结构和序列。然后,精炼后的图通过特定视图的网络进行编码,并通过对比学习进行对齐。此外,多任务学习框架通过结合多个目标来增强模型,将DDI预测与知识图谱规范化和对比对齐任务结合起来,以防止过拟合并确保泛化能力。在DrugBank和KEGG数据集上的广泛实验表明,KA-DDI的性能显著优于现有的基线方法。结果证实,我们的框架有效缓解了知识过载和交互作用主导性问题,从而实现了更稳健和准确的DDI预测。

引言

药物相互作用(DDI)预测在药物开发、临床用药安全及相关领域中发挥着重要作用(Bansal等人,2014年)。准确识别药物之间的相互作用有助于避免不良反应、提高治疗效果并保护患者健康。传统的DDI预测方法(如基于实验的方法)虽然准确度很高,但成本高昂、耗时且劳动密集,难以大规模应用(Lyu等人,2021年;Vilar等人,2014年)。计算方法逐渐受到关注,其中基于知识图谱的方法为DDI预测带来了新的视角。
知识图谱(KGs)作为一种强大的工具,用于整合多种与药物相关的信息,如化学结构、靶点相互作用和疾病治疗关系,为理解药物之间的潜在联系提供了丰富的上下文知识(Lin等人,2023年;Lin, Quan, Wang, Ma, & Zeng,2020年;Luo等人,2024年;Ma等人,2024年;Yue等人,2020年)。通过将KGs与先进的神经网络架构相结合,这一领域取得了显著进展(Dou, Tang, Tiwari, Ding, & Guo,2024年;Kipf,2016年)。早期的工作集中在KG嵌入方法(如KG-DDI Karim等人,2019年)和对抗性自编码器(Dai, Guo, Guo, & Eickhoff,2021年)上,这些方法旨在将异构的生物医学实体编码到统一的向量空间中。尽管这些模型为利用KG语义提供了基础,但它们在表示复杂的关系结构方面存在局限性。为了解决这一限制,后续研究引入了图神经网络(GNNs)。基于图卷积网络(GCNs)(Lin等人,2020年)、图摘要模块(Yu等人,2021年)和图注意力网络(GATs)(Hong, Luo, Jin, & Liu,2022年;Su, Hu, You, Hu, & Zhao,2022a)的方法被开发出来,以利用局部图连接性和信息传递,从而实现对药物-实体关系的更 expressive建模。这一系列工作的动机是为了纳入简单嵌入模型无法捕捉的拓扑依赖性。最近,该领域转向了混合和多级方法,以建模更高阶的模式并整合多种数据模态。例如,KG2ECapsule(Su等人,2022b)使用胶囊网络来保留多关系交互信息,而TIGER(Su, Hu, You, Yu, & Hu,2024)使用关系感知的Transformer注意力来捕捉全局和高阶依赖性。MIRACLE(Wang, Min, Chen, & Wu,2021)进一步引入了多视图对比框架,以平衡分子级和交互级信息。这些方法的出现源于需要克服传统GNNs的表达能力限制,并更好地利用生物医学KGs中的异构知识。
尽管取得了这些进展,基于KG的DDI预测仍面临两个生物学上的挑战。首先,由于生物医学数据库中确认的DDIs分布稀疏但相关性强,交互作用主导性问题凸显;这些高置信度的交互标签倾向于主导模型优化,导致药物表示过度拟合观察到的交互模式,同时忽略了诸如共享代谢酶、重叠治疗靶点或共同代谢途径等互补的机制信号(Bai, Gu, Sun, & Wang,2020年;Ratajczak, Joblin, Ringsquandl, & Hildebrandt,2022年)。其次,由于生物医学KGs的异构性,其中包含大量关系(如药物-疾病、疾病-基因、途径-基因),这些关系与DDI形成的生物学相关性极不均衡,从而导致了知识过载。在信息传递过程中,这些信号被传播和放大,掩盖了有用信息,阻碍了准确预测(Liu, He, Zhang, & Li,2024年;Ratajczak等人,2022年;Wang等人,2023年)。此外,之前的工作(如TIGER(Su等人,2024年)、MIRACLE(Wang等人,2021年)和KG2ECapsule(Su等人,2022b)要么依赖于通用增强,要么仅专注于KG建模,但没有同时解决这两个问题,同时整合多模态分子知识。
为了解决这些挑战,我们提出了KA-DDI,这是一个知识自适应框架,它以统一的方式整合了分子特征、交互信号和异构的生物医学知识。KA-DDI首先通过融合分子图的结构特征和SMILES字符串的序列模式来获得互补的药物表示。然后引入双图自适应对比学习模块,其中交互作用和知识图视图通过对比目标独立编码和对齐,以减轻交互作用主导性并抑制KG噪声。最后,融合的分子特征和跨视图嵌入在统一的预测器中结合,并通过结合分类监督和对比一致性的多任务损失进行优化。这种设计使KA-DDI能够学习到更稳健、基于生物学的表示,以实现准确的DDI预测。本文的主要贡献总结如下:
  • 我们提出了KA-DDI,这是一个集成框架,它将双图对比学习与多任务训练相结合,同时解决知识过载和交互作用主导性这两个挑战。多任务学习框架结合了多个目标,通过将DDI预测与知识图谱规范化和对比对齐结合起来,确保了模型的稳健性和泛化能力。
  • 我们引入了一种任务驱动的、关系感知的图增强策略。与通用的扰动方法不同,我们的方法根据药理学相似性和知识图谱语义动态优化图连接性,有效地去除了输入结构的噪声,以实现更稳健的表示学习。
  • 我们设计了一个有效的多模态特征融合模块,它整合了分子图和序列表示,为药物表示学习提供了全面的基础。在基准数据集上的广泛实验表明,KA-DDI达到了最先进的性能,消融研究证实了每个提出组件的关键作用。
  • 相关工作

    相关工作

    近年来,生物信息学数据的快速增长促进了各种高效的计算机辅助药物相互作用预测方法的发展。这些方法可以大致分为三类:基于分子图的方法、基于知识图谱的方法、混合和多级方法。

    问题和符号定义

    DDI图: 给定一个药物相互作用图 Gd={(di,yij,dj)},其中 di, djD 表示不同的药物,D 表示所有药物的集合。变量 yij ∈ {0, 1} 表示药物 didj 之间是否存在相互作用。具体来说,yij=1 表示存在相互作用,否则 yij=0。该图封装了已知的药物相互作用信息。
    知识图谱: 给定知识图谱 Gk={(h,r,t),其中每个三元组 (h, r, t) 表示存在一个

    数据集

    在这项研究中,我们遵循了Su(2024年)的工作,选择了两个广泛使用的基准数据集——DrugBank(Knox等人,2024年)和KEGG(Kanehisa,2002年)——来评估我们方法的有效性。从DrugBank中,我们获得了1,052种药物和10,404个批准的药物-药物相互作用。对于KEGG,我们提取了相关的相互作用信息,将药物名称映射到DrugBank标识符,并整理了一个包含786种药物和13,787个DDIs的数据集。
    对于每个药物节点,我们收集了它的SMILES字符串

    结论与未来工作

    在本文中,我们介绍了KA-DDI,这是一个知识自适应对比学习框架,它解决了基于知识图谱的药物相互作用预测中的两个关键挑战:交互作用主导性和知识过载。通过结合多模态分子初始化、双图自适应增强和跨视图对齐,KA-DDI有效地结合了分子特征、DDI结构和KG语义。在基准数据集上的实验表明,其性能明显优于

    未引用的参考文献

    表1。

    作者声明

    余丽:概念化、方法论、软件、写作——原始草稿。刘家明:数据整理、写作——原始草稿准备。李月超:可视化、研究。尤海茹:可视化、研究。尤珠红:写作——审阅和编辑。袁阳:数据整理。米成刚:数据整理。

    利益冲突声明

    作者声明他们没有已知的竞争财务利益或个人关系可能会影响本文报告的工作。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号