基于邻域重要性采样与记忆交互神经网络的多标签药物相互作用预测模型研究

【字体: 时间:2025年09月21日 来源:Asian Journal of Psychiatry 4.5

编辑推荐:

  本综述提出一种创新的记忆交互神经网络(MINN),结合药物分子序列与知识图谱(KG)语义信息,通过邻域重要性采样策略(NIS)优选高连接度节点,并利用多头注意力机制挖掘药物相互作用(DDIs)三元组间的潜在关联。实验在KEGG和OGB-biokg数据集上验证了模型在多标签DDI预测中的优越性,为临床安全用药提供重要技术支持。

  

Highlight

多药联合使用常引发药物-药物相互作用(DDIs),包括可能增加发病率和死亡率风险的不良药物反应(ADRs)。由于药理学复杂性,识别潜在DDIs面临重大挑战。知识图谱(KG)的最新进展通过提供强大框架表示药物与其他实体(如蛋白质、疾病和药物属性)间的各种关系,助力DDI预测。然而,当前基于网络的方法通常独立编码三元组,未能揭示DDI三元组间的交互信息。此外,均匀采样方法可能忽略相邻节点属性的差异。本研究提出一种新颖的记忆交互神经网络(MINN)用于DDI预测,整合药物分子序列与药物知识图谱的语义信息。具体而言,我们引入邻域重要性采样策略(NIS),选择性采样高连接度邻居,提高计算效率并减少噪声。我们还设计了一个记忆交互模块,利用多头注意力机制和深度神经网络(DNN)捕捉DDI三元组间的相互作用。在KEGG和OGB-biokg数据集上的实验评估证明,我们的模型在预测DDIs方面优于经典和最先进方法。

Introduction

药物-药物相互作用(DDIs)指药物同时或连续给药时药效的变化。Finkel等人报告,当联合使用2-5、6-10和超过10种药物时,不良DDI发生率分别为18.6%、81.4%和100%,可能导致严重不良后果。为防止这些不良影响,识别潜在DDIs至关重要。某些关键DDIs甚至可能导致抗体依赖性增强,致使药物撤市。因此,有效识别可能的DDIs对于确保更安全、更准确的患者处方实践至关重要。然而,仅预测药物间是否存在相互作用并不能解决数十种DDI类型的实际问题。DDI预测任务更重要的部分是准确识别两个药物实体之间的关系类型,而不仅仅是它们之间是否存在相互作用,这可以有效指导医生辅助处方和安全用药,这也是本工作的目标。

生物医学知识图谱包含各种真实世界生物分子(如蛋白质、药物、疾病)及其间关系,以描述相互作用。它可以提供有关药物属性和药物相关三元事实的更详细信息,丰富药物向量表示,有助于提高模型性能并增加模型可解释性。因此,基于知识图谱的方法在该领域受到关注。这些模型通常将知识图谱纳入低维连续向量空间,同时保留一些图属性。图嵌入技术主要有两类:翻译距离模型和语义匹配模型。翻译距离模型通过分析两个关联实体间的距离来评估给定事实的可靠性,包括TransE、TransH和TransR等方法。相反,后者通过分析实体及其在向量空间中表示的相互关系的基础语义来测量事实的可信度,例如RESCAL。此外,图神经网络的发展为结合图卷积网络思想的新型KG模型铺平道路。这些模型非常擅长提取KG中的复杂结构和语义关系,例如KGAT和R-GCN。此外,某些方法已用于DDI预测并产生了有希望的结果。一些DDI研究专注于二元分类,预测两种药物是否相互作用。然而,了解具体的相互作用关系类型对临床应用有帮助。由于一种药物可能与多种药物相互作用,甚至两种药物之间存在多种类型的相互作用。即,药物A可能增加药物B的心脏毒性、肝毒性或中枢神经毒性活动。唯一的三元组包括,其中任何变化,我们称之为不同的独立三元组。在这项工作中,我们的目标是预测DDI多标签分类问题。准确识别两个药物实体之间的关系类型比确定它们之间是否存在相互作用更为关键。Su等人提出了KE2ECapsule端到端框架来解决多标签DDI预测任务。

然而,一方面,这些基于深度学习的聚合图嵌入方法在构建邻域时从每个节点的邻居集合中随机采样节点,但忽略了相邻节点本身的差异。另一方面,许多现有方法仅专注于对药物相关三元事实进行孤立编码分析,未能考虑药物属性以及实体和关系间来自预先存在三元组的潜在交互信息。此外,当前研究表明节点属性对于复杂网络的精确分析至关重要。因此,有必要将药物属性附加到药物表示向量中,并提取它们的交互信息以增强DDI预测性能。

为克服上述局限性并有效建模基于生物医学KG的多关系DDI数据,我们提出了一种新颖的记忆交互神经网络(MINN),以端到端方式整合药物属性和药物知识图谱的语义信息。我们的模型包括三部分:编码器-解码器层、图嵌入层和记忆交互模块。KG中药物的属性由其相应的简化分子输入行条目系统(SMILES)序列表示。编码器-解码器层使用从相应属性导出的嵌入向量初始化药物表示。图嵌入层然后优先选择连接强度高的相邻节点,并采用关系感知的多跳聚合方法学习药物的表示向量。记忆交互模块主要包括多头点积注意力机制和深度神经网络(DNN)。多头点积机制用于挖掘药物实体和关系的交互信息,以确定最终的药物向量表示,从而预测药物间的具体关系类型。使用编码器-解码器层处理KG的药物属性,图嵌入层聚合邻居节点信息以丰富药物向量表示,这些操作解释了模型中包含的结构层如何分析特定特征。未来,我们将考虑分析药物分子的内部结构以进一步阐述模型可解释性。注意,在这项工作中,我们采用破坏正例的方法生成负样本,其中正例是已知的DDI多标记数据。破坏正例的具体步骤将在实验设置部分给出。简而言之,本研究的贡献可概述如下:

  • 我们引入了一种用于多标签DDI预测的记忆交互神经网络(MINN),利用药物属性和药物知识图谱的语义信息丰富药物特征表示。

  • 我们提出了邻域重要性采样策略(NIS),优先选择具有强局部连接性的节点,确保更有意义和相关的特征聚合,优化计算效率并减少冗余。

  • 我们设计了记忆交互模块,探索药物实体和关系间的交互特征,以预测药物间的具体关系类型。

第二节主要介绍相关工作。第三节描述我们提出的模型的细节。实验和讨论在第四节呈现。最后部分是第五节中的结论。

Section snippets

Related work

多年来,基于网络的模型采用了各种网络嵌入算法预测药物-药物相互作用。这些嵌入算法可大致分为三种主要类型:(i) 矩阵分解(MF),(ii) 随机游走(RW),和 (iii) 基于神经网络(NN)的方法。例如,Zhu等人提出了一种称为概率依赖矩阵三因子分解(PDMTF)的属性监督学习模型用于...

Methodology

接下来,我们首先将多标签药物-药物相互作用预测建模为链接预测问题,并介绍全文使用的符号。然后我们提出算法的详细描述。

Open datasets

这项工作在两个数据集上进行实验以证明我们提出模型的有效性。

OGB-biokg:OGB-biokg是由斯坦福大学使用大量生物医学数据存储库数据创建的生物医学知识图谱,包含五种类型的实体,即药物、副作用、疾病、蛋白质和蛋白质功能。数据集包含51种连接两类实体的有向关系,包括39种药物-药物相互作用,8种...

Conclusion and future work

这项工作介绍了一种使用生物医学知识图谱进行多标签药物-药物相互作用预测的记忆交互神经网络(MINN),在KEGG和OGB-biokg数据集上展示了强大性能。该模型有效整合药物属性序列和语义信息,使用优先和随机采样技术降低计算成本并减轻噪声。然而,其临床应用受到缺乏患者级数据和...的限制。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号