药物相互作用(DDI)预测在药物开发、临床用药安全及相关领域中发挥着重要作用(Bansal等人,2014年)。准确识别药物之间的相互作用有助于避免不良反应、提高治疗效果并保护患者健康。传统的DDI预测方法(如基于实验的方法)虽然准确度很高,但成本高昂、耗时且劳动密集,难以大规模应用(Lyu等人,2021年;Vilar等人,2014年)。计算方法逐渐受到关注,其中基于知识图谱的方法为DDI预测带来了新的视角。
知识图谱(KGs)作为一种强大的工具,用于整合多种与药物相关的信息,如化学结构、靶点相互作用和疾病治疗关系,为理解药物之间的潜在联系提供了丰富的上下文知识(Lin等人,2023年;Lin, Quan, Wang, Ma, & Zeng,2020年;Luo等人,2024年;Ma等人,2024年;Yue等人,2020年)。通过将KGs与先进的神经网络架构相结合,这一领域取得了显著进展(Dou, Tang, Tiwari, Ding, & Guo,2024年;Kipf,2016年)。早期的工作集中在KG嵌入方法(如KG-DDI Karim等人,2019年)和对抗性自编码器(Dai, Guo, Guo, & Eickhoff,2021年)上,这些方法旨在将异构的生物医学实体编码到统一的向量空间中。尽管这些模型为利用KG语义提供了基础,但它们在表示复杂的关系结构方面存在局限性。为了解决这一限制,后续研究引入了图神经网络(GNNs)。基于图卷积网络(GCNs)(Lin等人,2020年)、图摘要模块(Yu等人,2021年)和图注意力网络(GATs)(Hong, Luo, Jin, & Liu,2022年;Su, Hu, You, Hu, & Zhao,2022a)的方法被开发出来,以利用局部图连接性和信息传递,从而实现对药物-实体关系的更 expressive建模。这一系列工作的动机是为了纳入简单嵌入模型无法捕捉的拓扑依赖性。最近,该领域转向了混合和多级方法,以建模更高阶的模式并整合多种数据模态。例如,KG2ECapsule(Su等人,2022b)使用胶囊网络来保留多关系交互信息,而TIGER(Su, Hu, You, Yu, & Hu,2024)使用关系感知的Transformer注意力来捕捉全局和高阶依赖性。MIRACLE(Wang, Min, Chen, & Wu,2021)进一步引入了多视图对比框架,以平衡分子级和交互级信息。这些方法的出现源于需要克服传统GNNs的表达能力限制,并更好地利用生物医学KGs中的异构知识。
尽管取得了这些进展,基于KG的DDI预测仍面临两个生物学上的挑战。首先,由于生物医学数据库中确认的DDIs分布稀疏但相关性强,交互作用主导性问题凸显;这些高置信度的交互标签倾向于主导模型优化,导致药物表示过度拟合观察到的交互模式,同时忽略了诸如共享代谢酶、重叠治疗靶点或共同代谢途径等互补的机制信号(Bai, Gu, Sun, & Wang,2020年;Ratajczak, Joblin, Ringsquandl, & Hildebrandt,2022年)。其次,由于生物医学KGs的异构性,其中包含大量关系(如药物-疾病、疾病-基因、途径-基因),这些关系与DDI形成的生物学相关性极不均衡,从而导致了知识过载。在信息传递过程中,这些信号被传播和放大,掩盖了有用信息,阻碍了准确预测(Liu, He, Zhang, & Li,2024年;Ratajczak等人,2022年;Wang等人,2023年)。此外,之前的工作(如TIGER(Su等人,2024年)、MIRACLE(Wang等人,2021年)和KG2ECapsule(Su等人,2022b)要么依赖于通用增强,要么仅专注于KG建模,但没有同时解决这两个问题,同时整合多模态分子知识。
为了解决这些挑战,我们提出了KA-DDI,这是一个知识自适应框架,它以统一的方式整合了分子特征、交互信号和异构的生物医学知识。KA-DDI首先通过融合分子图的结构特征和SMILES字符串的序列模式来获得互补的药物表示。然后引入双图自适应对比学习模块,其中交互作用和知识图视图通过对比目标独立编码和对齐,以减轻交互作用主导性并抑制KG噪声。最后,融合的分子特征和跨视图嵌入在统一的预测器中结合,并通过结合分类监督和对比一致性的多任务损失进行优化。这种设计使KA-DDI能够学习到更稳健、基于生物学的表示,以实现准确的DDI预测。本文的主要贡献总结如下:
•我们提出了KA-DDI,这是一个集成框架,它将双图对比学习与多任务训练相结合,同时解决知识过载和交互作用主导性这两个挑战。多任务学习框架结合了多个目标,通过将DDI预测与知识图谱规范化和对比对齐结合起来,确保了模型的稳健性和泛化能力。
•我们引入了一种任务驱动的、关系感知的图增强策略。与通用的扰动方法不同,我们的方法根据药理学相似性和知识图谱语义动态优化图连接性,有效地去除了输入结构的噪声,以实现更稳健的表示学习。
•我们设计了一个有效的多模态特征融合模块,它整合了分子图和序列表示,为药物表示学习提供了全面的基础。在基准数据集上的广泛实验表明,KA-DDI达到了最先进的性能,消融研究证实了每个提出组件的关键作用。