
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于元路径与简化邻域聚合的药物-靶标相互作用预测模型SNADTI的创新研究
【字体: 大 中 小 】 时间:2025年06月13日 来源:Methods 4.2
编辑推荐:
本研究针对生物网络中数据规模小、不平衡和噪声干扰导致的注意力机制不稳定问题,提出基于平均聚合的简化邻域聚合方法SNADTI。通过构建异构生物网络,采用单层长元路径结构和语义注意力融合策略,显著提升DTI预测效率与准确性,在三个异构数据集上超越12种基线方法,为药物重定位提供高效计算工具。
在药物研发领域,准确预测药物-靶标相互作用(DTI)是加速药物重定位和发现的关键环节。当前基于元路径(Metapath)的预测方法普遍依赖注意力机制区分邻居重要性,但在小规模、不平衡的生物网络中,这种方法容易受到噪声和缺失数据的干扰,导致权重学习不稳定、效率低下以及过拟合风险增加。这些局限性严重制约了DTI预测模型在真实生物医学场景中的应用效果。
为突破这一技术瓶颈,研究人员开发了名为SNADTI的创新模型。该研究通过系统性实验证明,在生物网络特有的数据条件下,传统的多层注意力机制并非最优选择。相反,采用简化邻域聚合策略——即通过单次平均聚合预处理替代迭代注意力计算,配合长元路径捕捉高阶语义信息,能够更稳定高效地完成DTI预测任务。
研究方法的核心在于构建异构生物网络G=(V,E,Tv
,Te
),其中包含药物(D)、靶标(T)、疾病(I)等多类型节点。关键技术路线包含:1) 简化邻域聚合阶段,使用公式(3)所示的矩阵乘法实现单次特征聚合;2) 特征转换环节通过类型特定矩阵W0
统一特征空间;3) 语义融合模块采用多头注意力机制整合不同元路径特征;4) 构建药物-靶标对(DTP)相关图,通过GCN层挖掘潜在关联。实验数据来源于DrugBank、HPRD等公共数据库,涵盖708-2,214种药物和1,152-1,968个靶标。
研究结果部分揭示多项重要发现:
3.1 简化邻域聚合
通过公式(1)的均值聚合操作,证明单次聚合即可有效提取结构特征,较MHGNN降低O(nd(ke+kd))计算复杂度。图3显示训练时间缩短40%的同时,AUC提升1.46%。
3.4 消息更新
采用GAT的多头注意力策略,通过公式(6)的LeakyReLU激活函数δ实现元路径实例的差异化整合。消融实验(图4)显示该设计使Hetero-C的AUPR达到0.9995±0.003。
4.4 预测性能
在三个异构数据集测试中,SNADTI的MCC指标分别提升5.7%、5.73%和3.75%(表4-5)。案例研究(表7)验证了前100对预测结果中Mycophenolic acid-TLR9等新型相互作用的生物学合理性。
4.6 特征分析
图6的余弦相似度比较表明,平均聚合使特征相似性提高15-20%,证明其在平滑噪声方面的优势。而元路径长度分析(图7)显示长度为5时各项指标达到峰值,说明该长度能平衡信息丰富度与计算效率。
这项研究的创新价值主要体现在三个方面:首先,提出的简化聚合策略为生物网络分析提供了新范式,证明在特定条件下简单方法可能优于复杂机制;其次,长元路径与单层结构的组合突破了传统GNN的深度限制;最后,模型在保持精度的同时显著提升计算效率,使其更适合资源有限的医学研究场景。未来工作可考虑引入动态时间建模,以更好反映真实生物过程的时序特性。这些发现为异构生物网络分析提供了方法论参考,对推动计算药物发现具有重要意义。
生物通微信公众号
知名企业招聘