MFHNN-DDI:基于分子片段的超图神经网络用于药物-药物相互作用预测

《Neurocomputing》:MFHNN-DDI: Molecular fragment-based hypergraph neural networks for drug–drug interaction prediction

【字体: 时间:2025年10月28日 来源:Neurocomputing 6.5

编辑推荐:

  提出基于分子片段的超图神经网络MFHNN-DDI,整合分子结构、序列特征和交互网络,有效捕捉高阶依赖,提升药物相互作用预测精度。

  药物-药物相互作用(DDI)的准确预测对于推动联合治疗和药物发现具有重要意义。然而,现有方法面临两个关键局限:分子子结构关系建模不足以及多源药物信息整合不够充分。为解决这些问题,本文提出了一种新的模型——基于分子片段的超图神经网络用于DDI预测(MFHNN-DDI)。该模型利用超图神经网络来建模高阶分子交互,并采用多编码器融合技术,整合异构药物信息。首先,MFHNN-DDI构建分子片段超图,以捕捉药物及其子结构之间的高阶交互,从而比传统成对方法提供更丰富的分子关系表示。其次,我们设计了一种多编码器架构,协同结合三种互补的信息来源:(1)用于片段级关联的超图编码器,(2)用于网络级DDI模式的图卷积,以及(3)结合残差连接的1D卷积,用于序列级特征。第三,我们的融合机制整合这些互补的表示,以捕捉局部分子细节和全局交互模式。在两个真实数据集上的实验结果表明,MFHNN-DDI优于十二种最先进的基线模型。值得注意的是,MFHNN-DDI在DDInter数据集上表现出色,其准确率(ACC)和F1分数均超过了特定阈值,分别比次优方法提升了显著幅度。

药物-药物相互作用(DDI)指的是在另一种药物同时使用的情况下,一种药物的药理活性发生变化的现象。在管理复杂疾病时,单一疗法常常不够,导致联合疗法的广泛应用。然而,同时使用多种药物可能会引发不良的DDI,这可能降低治疗效果或造成有害的副作用,严重时甚至可能危及患者的生命。此外,准确识别DDI对于药物开发至关重要,因为早期发现有助于预防不良后果,并已成为医学和制药研究的核心关注点。传统的体外和临床研究主要依赖于手动设计和小规模验证,过程耗时、成本高,且难以全面反映药物组合空间的复杂性。因此,计算方法逐渐成为预测DDI的重要工具,借助人工智能和大规模生物医学数据库,提高预测效率。

早期的计算DDI预测模型主要依赖于药物的化学结构信息,尤其是简化分子输入线性入口系统(SMILES)。SMILES通过预定义的语法规则和符号,将化学分子结构表示为线性符号。然而,仅依赖SMILES进行化学结构表示,会导致药物特征提取受限。为解决这一限制,研究人员开发了两种主要方法来整合多源药物信息:基于属性的方法和基于网络的方法。基于属性的方法结合了副作用、靶点、酶和蛋白质等信息。例如,CNN-Siam通过将三种数据类型(化学结构、靶点和酶)进行独热编码,利用Jaccard函数计算药物相似性,并将其输入卷积神经网络(CNNs)架构,生成最终的嵌入用于DDI预测。CNN-DDI则通过基于药物类别、靶点、通路和酶计算药物相似性矩阵,创建特征向量,再输入CNN预测模块。这些方法通过结合多源信息,提高了药理属性的多样性和表示能力。然而,它们通常独立处理不同的数据源,忽略了拓扑结构信息,无法有效提取交互信息。此外,它们高度依赖高质量和全面的药物数据作为输入。在实际应用中,许多药物,尤其是新药或较少使用的药物,并没有完整的属性数据。这种对外部信息的依赖限制了它们在大规模药物预测和实际临床应用中的可扩展性。

另一种方法从网络拓扑的角度研究药物交互模式。这些方法通过将药物视为节点,DDI视为连接边,构建DDI网络。DDI预测则通过判断两个药物节点之间是否存在连接来实现。为了整合多源信息,一些研究引入了多类型边,将不同的DDI类型整合到网络结构中,以反映更复杂的药物连接。例如,MDF-SA-DDI通过考虑多样化的药物交互作为边,利用多源药物融合和自注意力方法提取药物特征,显著提高了DDI预测的准确性和可解释性。为了更好地适应异构多源信息,其他方法构建了异构图,其中节点和关系各不相同,将药物、蛋白质、化学结构和通路等实体作为节点,并将实体间的关联作为异构边。然而,上述方法忽略了药物分子的内部属性。由于DDI本质上源于分子层面的机制,缺乏对药物分子子结构的关注,导致关键的DDI信息缺失。

为了从药物分子子结构中捕捉DDI信息,大多数最新方法构建了分子图,将原子作为节点,化学键作为边,利用注意力机制提取子结构信息。例如,MSMDL-DDI采用多层软掩码双视图学习框架,从分子图中提取关键子结构,整合药物内部和外部的交互信息,以实现高精度的DDI预测。然而,分子图的构建依赖于二元连接,难以捕捉多个元素子结构和药物之间的高阶依赖关系。这一限制影响了模型反映复杂药物交互机制的能力。

为克服上述困难,近期研究开始探索基于超图的拓扑结构用于DDI预测。与标准的常规图不同,超图中的超边可以连接多个节点。这一特性使得超图能够建模药物之间的复杂高阶依赖关系。例如,SPARSE利用稀疏超图神经网络,通过学习药物和副作用的潜在特征组合,捕捉高阶相关性,提高预测性能。为了提取药物内部的DDI信息,HyGNN通过从药物SMILES字符串中提取化学子结构,构建超图,收集药物间的高阶结构相似性,以实现成功的DDI预测。然而,当前的超图模型通常专注于单一视角的特征提取——要么结构特征,要么表型特征,无法全面整合用于捕捉药物交互机制完整复杂性的多源药物信息。这一限制导致多源药物信息未被充分利用,从而降低了模型预测的全面性和准确性。此外,使用子结构构建超图的模型忽略了分子功能基团的属性,导致语义信息的丢失。

为解决子结构与药物之间缺失的高阶语义信息以及缺乏多源药物信息的问题,本文提出了MFHNN-DDI,一种基于分子片段的超图神经网络用于DDI预测。我们的方法整合了三种互补的信息来源:药物分子片段信息、药物序列特征和多级DDI网络拓扑。具体而言,MFHNN-DDI采用三模块架构。首先,MFHNN-DDI使用BRICS算法将药物SMILES分解为分子片段,构建超图。这一表示捕捉了药物的DDI相关内部特征。其次,为了在全局层面获取药物序列特征,MFHNN-DDI对药物SMILES进行编码,并通过多层1D卷积编码器提取特征。最后,我们应用多层图卷积编码器以捕捉多级交互模式。这种多视角设计确保了特征的互补性:分子片段提供机制洞察,全局序列捕捉整体药物属性,DDI图编码交互拓扑。

本文的主要贡献如下:首先,提出了一个新的DDI预测模型MFHNN-DDI。该模型创新性地利用分子片段构建超图,以捕捉药物的子结构信息。通过超图建模药物与子结构之间的高阶关系,从而提高DDI预测的准确性。其次,我们设计了一种多组件整合框架,协同结合三种互补的信息来源:通过超图神经网络提取的局部分子片段特征、通过多层1D卷积提取的全局药物序列特征,以及通过图卷积提取的多级DDI网络模式。这种全面整合克服了现有(超图)方法在单一视角信息提取上的不完整特征提取问题。最后,我们在真实药物数据集上进行了广泛的实验,将MFHNN-DDI与现有模型进行比较。实验结果表明,MFHNN-DDI在预测DDI方面优于其他基线模型。同时,消融实验验证了关键架构组件的有效性。

本文的其余部分组织如下。第二部分系统回顾了DDI预测领域的相关研究。第三部分详细阐述了MFHNN-DDI方法的技术实现和架构设计。第四部分描述了实验设置,并展示了MFHNN-DDI的性能和评估结果。最后,第五部分总结并结束研究工作。

在这一部分,我们将回顾与DDI预测相关的现有研究。由于MFHNN-DDI的核心模块涉及DDI网络、超图和分子片段,因此在本节中,我们将从网络、药物子结构和超图三个维度深入探讨当前DDI预测领域应用的深度学习技术的研究现状。首先,网络层面的研究主要关注药物之间的相互作用关系。这些研究通常将药物视为节点,将DDI视为连接节点的边,构建药物相互作用网络。通过图神经网络(GNNs)等技术,对网络结构进行学习,以预测药物之间的相互作用。这种方法能够捕捉药物之间的关系,但通常忽略药物分子的内部结构信息,难以全面反映DDI的复杂性。其次,药物子结构层面的研究主要关注分子结构的特征提取。这些研究通过将药物分子分解为片段或原子,利用图卷积或注意力机制提取关键特征,以预测药物之间的相互作用。这种方法能够捕捉分子层面的细节,但通常无法有效整合多源信息,导致模型的预测能力受限。最后,超图层面的研究主要关注药物之间的高阶依赖关系。这些研究通过构建超图,将药物和其子结构之间的关系建模为超边,从而捕捉更复杂的交互模式。这种方法能够有效建模高阶依赖关系,但通常仅关注单一视角的特征提取,无法全面整合多源药物信息,限制了模型的预测全面性和准确性。

在本节中,我们将详细介绍MFHNN-DDI模型的整体架构和核心组件,包括多层图卷积编码器、多层1D卷积编码器、超图构建模块和超图编码器。MFHNN-DDI的创新之处在于使用药物和分子片段构建超图,利用超图在表示复杂关联关系方面的独特优势,有效捕捉药物分子中嵌入的化学特征信息。具体而言,MFHNN-DDI首先使用BRICS算法将药物SMILES分解为分子片段,构建超图。这一过程能够捕捉药物的内部结构信息,并为后续的特征提取提供基础。接下来,为了在全局层面获取药物的序列特征,MFHNN-DDI对药物SMILES进行编码,并通过多层1D卷积编码器提取特征。这一步骤能够捕捉药物的整体属性,为模型提供更全面的表示。最后,通过多层图卷积编码器,MFHNN-DDI能够捕捉多级的DDI交互模式,从而实现对药物交互机制的全面建模。

为了进一步提高模型的预测能力,MFHNN-DDI采用多编码器融合机制,将三种互补的表示进行整合。这种融合机制能够有效结合局部分子细节和全局交互模式,提高模型对DDI的预测准确性。此外,MFHNN-DDI在特征提取过程中引入了多视角设计,确保不同层面的信息能够相互补充,从而提高模型的整体表现。这种设计不仅能够捕捉药物的分子层面信息,还能够整合药物的序列特征和网络交互模式,为DDI预测提供更全面的视角。

在实验部分,本文详细描述了多个实验,以评估MFHNN-DDI的性能。实验部分分为几个子部分:首先,第4.1节和第4.2节介绍了两个真实世界数据集和实验设置,包括评估模型性能的指标以及多种比较方法的归纳和分类。其次,第4.3节和第4.4节分别介绍了比较实验的结果和分析,以及统计测试和消融实验的结论。第4.5节和第4.6节则进一步展示了MFHNN-DDI在不同实验条件下的表现,并分析了其在预测DDI方面的优势。第4.7节和第4.8节提供了对实验结果的进一步解释和讨论,强调了MFHNN-DDI在实际应用中的潜力。

通过实验,我们验证了MFHNN-DDI在DDI预测中的有效性。实验结果表明,MFHNN-DDI在两个数据集上的表现优于十二种最先进的基线模型。在DDInter数据集上,MFHNN-DDI的准确率和F1分数均超过了特定阈值,分别比次优方法提升了显著幅度。这表明,MFHNN-DDI在捕捉DDI的复杂性和多样性方面具有优势。此外,消融实验进一步验证了关键组件的有效性,例如超图构建模块、多层图卷积编码器和多层1D卷积编码器。这些实验结果表明,各个组件在模型整体表现中起到了重要作用,进一步支持了MFHNN-DDI在DDI预测中的有效性。

在实际应用中,MFHNN-DDI具有广泛的适用性。该模型能够有效整合多源药物信息,包括药物的分子片段、序列特征和网络交互模式,从而提高预测的准确性和全面性。此外,MFHNN-DDI的多视角设计使得不同层面的信息能够相互补充,为DDI预测提供更丰富的视角。这种方法不仅能够捕捉药物的分子层面信息,还能够整合药物的序列特征和网络交互模式,为DDI预测提供更全面的表示。这种设计能够有效提高模型在复杂药物交互机制中的预测能力,同时降低对高质量和全面药物数据的依赖。

MFHNN-DDI的提出,为DDI预测提供了一种新的方法。该模型通过构建超图,将药物及其子结构之间的高阶关系进行建模,从而提高预测的准确性。此外,通过多编码器融合机制,将三种互补的信息来源进行整合,确保不同层面的信息能够相互补充,提高模型的整体表现。这种方法不仅能够捕捉药物的分子层面信息,还能够整合药物的序列特征和网络交互模式,为DDI预测提供更全面的视角。通过实验,我们验证了MFHNN-DDI在真实世界数据集上的有效性,并展示了其在不同数据集上的表现。实验结果表明,MFHNN-DDI在预测DDI方面优于其他基线模型,具有较高的准确性和全面性。

MFHNN-DDI的研究还具有重要的现实意义。随着药物研发的不断推进,DDI的预测需求日益增加。传统的实验方法不仅耗时、成本高,而且难以覆盖药物组合空间的复杂性。因此,计算方法的引入对于提高DDI预测的效率具有重要意义。MFHNN-DDI作为一种基于超图的神经网络模型,能够有效捕捉药物之间的高阶依赖关系,同时整合多源信息,提高预测的准确性和全面性。这种方法不仅能够用于药物研发,还能够为临床应用提供支持,帮助医生更好地评估药物组合的安全性和有效性。

此外,MFHNN-DDI的研究还为未来药物交互机制的研究提供了新的思路。通过构建超图,将药物分子的内部结构和外部交互模式进行建模,能够更全面地反映药物之间的复杂关系。这种方法不仅能够捕捉药物的分子层面信息,还能够整合药物的序列特征和网络交互模式,为DDI预测提供更丰富的视角。未来的研究可以进一步探索如何优化超图构建和特征提取过程,以提高模型的预测能力。此外,还可以结合其他深度学习技术,如自注意力机制和图神经网络,以进一步提升模型的性能。

在实际应用中,MFHNN-DDI的研究成果具有重要的应用价值。该模型能够有效整合多源药物信息,提高DDI预测的准确性和全面性。这种方法不仅能够用于药物研发,还能够为临床应用提供支持,帮助医生更好地评估药物组合的安全性和有效性。此外,MFHNN-DDI的研究成果还可以为药物安全评估和药物相互作用机制的研究提供新的方法。通过构建超图,将药物分子的内部结构和外部交互模式进行建模,能够更全面地反映药物之间的复杂关系,为DDI预测提供更丰富的视角。

综上所述,MFHNN-DDI作为一种基于分子片段的超图神经网络模型,能够有效解决现有方法在DDI预测中的不足。通过构建超图,整合多源药物信息,并采用多编码器融合机制,该模型能够捕捉药物的分子层面信息、序列特征和网络交互模式,提高预测的准确性和全面性。实验结果表明,MFHNN-DDI在真实世界数据集上的表现优于其他基线模型,具有较高的预测性能。此外,消融实验进一步验证了关键组件的有效性,表明各组件在模型整体表现中起到了重要作用。MFHNN-DDI的研究成果不仅为DDI预测提供了新的方法,还为药物研发和临床应用提供了支持,具有重要的现实意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号