基于Transformer和超图卷积的多层超图框架用于药物相互作用预测

《Computational Biology and Chemistry》:A Multi-layer Hypergraph Framework for Drug-Drug Interaction Prediction Based on Transformer and Hypergraph Convolution

【字体: 时间:2026年01月09日 来源:Computational Biology and Chemistry 3.1

编辑推荐:

  药物-药物相互作用预测中,传统图模型难以捕捉多元素协同效应。本文提出MLHTHC框架,通过构建四属性(化学结构、ATC编码、药物类别、靶点)多层数值相似超图,利用谱哈明相似性加权优化各层数据贡献,结合超图卷积神经网络提取局部高阶结构特征,再通过Transformer进行跨属性全局依赖融合,最终用MLP预测DDI。实验表明MLHTHC在准确率上显著优于DPSP、DANN等基线模型。

  
卢申|冯虎|白立萍
青海师范大学计算机学院,中国青海省西宁市,810008

摘要

药物相互作用是药物研究、开发和临床实践中的一个关键问题。准确预测药物组合时的相互作用对于提高治疗安全性和优化用药方案至关重要。然而,潜在药物组合数量的指数级增长,以及传统图模型和多层网络预测模型的局限性——这些模型主要仅捕捉药物之间的二元关系,难以表示多元素协同作用——限制了预测性能。为了克服这些挑战,本文提出了一种基于Transformer和超图卷积(MLHTHC)的多层超图框架用于药物相互作用预测。该框架首先根据四种属性类型(化学结构、ATC代码、药物类别和相应靶点)构建药物的多层相似性超图。使用KEGG数据库中的药物相互作用数据作为基准,采用谱汉明相似性方法计算构建的超图与基准超图之间的结构相似性,从而确定每个超图层的重要性权重。随后,超图卷积神经网络对药物节点的每一层进行网络嵌入;Transformer模型用于对多层特征进行加权融合;最后,多层感知器(MLP)用于预测药物相互作用(DDIs)。实验结果表明,该模型的性能优于现有的方法(如DPSP和DANN),Transformer和超图卷积的结合显著提高了预测准确性。这种方法为药物相互作用预测提供了有效的工具。

引言

药物相互作用(DDIs)在现代医学中至关重要,尤其是在管理癌症、糖尿病和传染病等复杂疾病时。多靶点药物组合可以提高疗效、降低毒性并实现精确给药,但也增加了不良反应的风险,因此DDI评估对于治疗优化至关重要。然而,随着可用药物的快速增长,潜在的药物成对组合数量呈指数级增加,这给实验验证过程带来了巨大的成本和效率瓶颈。因此,开发准确高效的计算预测方法以探索潜在的DDIs对于优化组合疗法策略和加速药物开发与创新具有不可替代的核心价值(Shyr等人,2021年;Cho等人,2025年;Xie等人,2023年;Liu等人,2025年;Cohen等人,2025年;Chen等人,2022年;Jin等人,2023年)。
在药物相互作用(DDI)预测领域,已经开发了多种计算方法,包括文献数据挖掘、基因表达谱分析、网络建模以及机器学习和深度学习(Lim等人,2018年;Malki和Pearson,2020年;Vilar等人,2012年;Lin等人,2023年)。代表性的研究包括:Liu等人(2016年)提出了一种基于CNN的DDI提取方法,用于高效挖掘文献中的潜在相互作用;Madani Tonekaboni等人(2020年)利用基因表达谱量化通路活性,并构建了优于传统机器学习方法的预测模型;Yu等人(2022年)提出了NEWMIN框架,从多层药物网络中学习全面的节点特征;Cheng和Zhao(2014年)提出了HNAI框架,该框架整合了多维药物特征并结合多种机器学习模型实现DDI预测;DANN-DDI(Liu等人,2022年)通过图嵌入和注意力机制整合多源网络特征以学习药物对表示;Huang等人(2025年)提出了多模态模型MADRIGAL,该模型基于Transformer融合了多种类型的数据,其性能优于现有模型,并与临床实验结果一致。这些方法从不同角度为DDI预测提供了有效的技术支持。此外,现有的方法如MMDDI-SSE(Wang等人,2025a)、BiRNN-DDI(Wang等人,2025a)和MMPD-DTA(Wang等人,2025b)依赖于普通的图结构进行建模,专注于DDI类型识别、多模态特征融合或药物-靶点结合亲和力预测等任务。然而,这些方法都没有涉及多种药物之间的高阶关联建模。相比之下,本研究采用了超图结构进行建模。
尽管在利用多源信息方面取得了显著进展,但传统的图结构只能捕捉节点之间的成对关系,难以模拟多种药物之间的复杂高阶相互作用。为了解决这个问题,高阶网络建模因其能够表示多维药物关联而受到关注。HyGNN(Saifuddin等人,2023年)是一种基于超图神经网络的DDI预测模型,它使用药物SMILES字符串构建超图,其中药物是节点,子结构相似性形成超边。与传统图相比,超图通过多节点连接更好地编码了全局化学关系,增强了药物特征的表示。同样,Li等人(2024年)提出了MDNNSyn,这是一种多模态深度学习框架,它应用多层超图神经网络到药物协同超图中以提取拓扑特征,并结合语义相似性特征通过门控融合网络预测协同分数。近年来,超图和异构图模型在药物相互作用(DDI)预测领域取得了显著进展。MRHGNN(Chen等人,2025年)专注于协同DDI预测,它通过双通道编码融合了药物理化性质和相互作用特征。然而,它没有区分多特征视图中的高阶关联的优先级,也没有包括与DDI基准网络的精确对齐策略。PreciseADR(Gao等人,2025年)专注于患者级别的药物不良反应(ADR)预测,它构建了一个包含患者、疾病、药物和ADR的异构图,通过异构图神经网络(GNNs)学习患者表示,并捕捉图内的局部和全局依赖关系。然而,它仍然依赖于传统的异构图来模拟实体之间的成对关联,也没有优化由多药物组合引起的ADR的高阶相互作用,也没有引入超图来整合多种药物之间的复杂关联。
尽管这些方法展示了多层和高阶网络模型的潜力,但它们仍然存在固有的局限性,具体如下:
  • (1)
    多层网络可以整合多种药物属性,但受限于成对图结构,因此无法有效捕捉药物之间的高阶协同效应。
  • (2)
    现有的基于超图的方法能够建模高阶关系,但大多数采用单层设计,无法充分整合异构数据。此外,它们仅采用等权重融合策略处理多视图相似性信息,缺乏自适应的谱权重机制来区分不同视图的贡献,最终导致模型性能提升有限。
  • 为了解决多层网络受普通图结构限制以及超图单层设计的局限性,本研究提出了一种基于多层超图的DDI预测框架。该框架通过谱权重整合了多种相似性视图,并结合了Transformer和超图卷积。其目标是实现更准确和全面的复杂药物相互作用(DDIs)预测。
    本文的主要贡献如下:
  • (1)
    对于药物的化学结构、ATC代码、药物类别和相应靶点,我们设计了一种多层药物相似性超图构建方法。该方法利用超图的高阶关联特性,有效表征了基于不同属性的药物之间的相似性关系。此外,它通过谱权重整合了多种相似性数据,为后续的特征提取提供了结构化数据支持。
  • (2)
    我们提出了HGNN和Transformer的互补融合架构:HGNN专注于提取超图中药物的低阶结构特征,而Transformer增强了跨属性和跨药物的全局长距离依赖性。这两种方法形成了“局部结构+全局依赖性”的互补优势——消融实验结果验证,移除Transformer后F1分数下降5%,移除HGNN后下降3%。这充分证明了融合架构可以有效弥补单一模型的特征捕获缺陷,显著提高预测性能。
  • (3)
    我们引入了一种谱汉明加权策略:与传统的多层融合方法(如手动加权或简单平均)不同,该方法采用跨域传递谱汉明相似性方法,通过量化每个相似性超图层与KEGG基准DDI图之间的结构对齐来实现智能加权,为特征提取提供了精确的结构化支持。这是该方法首次应用于多层超图与基准DDI超图之间的直接对齐加权方案。
  • 部分摘录

    超图的定义

    基于超图的超网络定义最早由Berge(Berge,1985年)提出。设V={v1, v2, ……, vn}是一个有限的顶点集(其中v是超图的一个顶点),设E={e1, e2, ……, em}是一个超边集(其中e?,所有超边的并集是?jme=V),那么H=V被称为一个超图。
    节点度:对于超图H中的顶点v,节点度定义为包含该顶点的超边数量,表示为dH(v)={ev},即

    方法论

    在本节中,我们将介绍构建的药物相互作用(DDI)预测框架MLHTHC。首先,我们从DrugBank(版本5.1.12)获取药物的四个核心属性(化学结构、ATC代码、药物类别和相应靶点)。基于这些属性,我们生成相似性矩阵,并通过KEGG(版本112)进行基准评估后对其进行加权,然后将其整合到多层超图中。我们进一步验证了其幂律分布

    实验设置

    基于3470种药物和572569个已知的阳性相互作用,本研究使用静态随机负采样构建了阴性样本。具体来说,以一个阴性样本对应一个阳性样本的目标比例,从3470个药物节点中随机选择两种不同的药物形成候选对。在标准化药物对顺序并排除已知阳性相互作用对后生成了有效的阴性样本。设置了两个采样终止条件:

    结论

    为了解决传统图和多层网络难以表征药物多样性和协同作用的问题,本文提出了MLHTHC,这是一种结合Transformer和超图卷积的DDI预测框架。与DPSP和DANN等方法相比,MLHTHC表现出显著的优势。多层相似性超图能够准确表征药物的高维相互作用。消融实验确认了

    CRediT作者贡献声明

    冯虎:撰写——审稿与编辑、监督、资源获取、方法论、资金获取、概念化。卢申:撰写——原始草稿、可视化、监督、方法论、数据管理。白立萍:撰写——审稿与编辑、可视化、软件、方法论、形式分析、概念化。

    利益冲突声明

    作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普
    • 急聘职位
    • 高薪职位

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号