基于注意力网络与改进归纳矩阵补全的微生物-药物关联预测新方法SRGMCMDA
《Biomedical Signal Processing and Control》:Microbe-Drug association prediction based on attention networks and improved Inductive matrix Completion
【字体:
大
中
小
】
时间:2025年10月29日
来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
本文提出创新性计算模型SRGMCMDA,通过相似性网络融合(SNF)与重启随机游走(RWR)整合多源数据,结合Talking-head注意力机制与多层感知机(MLP)优化特征提取,最后采用卷积神经网络增强的归纳矩阵补全(CNNIMC)融合线性与非线性特征,在微生物-药物关联预测任务中实现AUC 0.9713、AUPR 0.9618的卓越性能,为药物重定位与微生物靶点发现提供新思路。
SRGMCMDA算法的性能与浅层特征学习方法息息相关。本文引入自编码器(SAE)、Line和Node2vec方法与本研究采用的RWR方法进行对比,结果如图5所示。
SAE、Line和Node2vec主要关注局部结构或一阶、二阶邻近关系。相比之下,RWR采用概率框架,通过整合多条潜在路径的信息来提取特征,而非依赖固定长度的随机游走序列。这种方法能更全面地捕捉网络中的高阶关联信息。
为验证RWR、MLP、CNN和IMC结构对SRGMCMDA模型预测准确性的影响,我们进行了五组实验。实验分组如表2所示。
如图6所示,SRGMCMDA模型在AUC和AUPR指标上均显著优于其他实验组。在第一实验组中,AUC值比第四组高出4.00个百分点,AUPR值高出5.29个百分点。这表明IMC结构在整合线性与非线性特征方面发挥了关键作用,有效提升了模型的预测性能。
为验证模型的适用性和鲁棒性,我们选取了MDAD、aBiofilm和DrugVirus三个数据集。这三个数据集的详细信息如表1所示。从表中可以看出,MDAD中的药物数量比aBiofilm少三倍,但比DrugVirus多五倍;MDAD中的关联信息量是aBiofilm的一半。经过5折交叉验证后,三个数据集的AUC和AUPR值均表现出色,证明了SRGMCMDA在不同数据规模和质量下的稳定性能。
在相同数据集上,我们将SRGMCMDA与前述先进方法进行了对比实验,包括SCSMDA、MFTLHNMDA、MDSVDNV、GCNMDA和GCNATMDA。对比模型的参数均经过优化以达到其最佳性能。模型性能指标对比如表3所示。
如表3所示,除AUC外,SRGMCMDA在所有指标上均优于SCSMDA、MFTLHNMDA、MDSVDNV、GCNMDA和GCNATMDA。尽管GCNMDA在AUC指标上略微超过SRGMCMDA,但SRGMCMDA在AUPR这一更严格的指标上表现更优,说明其在不同评估标准下均具有竞争力。
本节我们在三个数据集上进行案例分析,以进一步验证SRGMCMDA的预测结果。该方法通过相关文献验证了MDAD数据集中与大肠杆菌和HIV关联度最高的前10种药物;在aBiofilm数据集中,验证了与表没食子儿茶素没食子酸酯关联度最高的前10种微生物;由于COVID-19大流行的严重爆发导致众多伤亡,且亟需有效治疗药物,我们重点研究了与SARS-CoV-2相关的候选药物。
为全面比较SRGMCMDA与现有方法,我们从所用技术、预处理技术、数据集类型以及优缺点等角度分析了SRGMCMDA和五种先进方法——SCSMDA、MFTLHNMDA、MDSVDNV、GCNMDA和GCNATMDA。表8展示了详细对比,突出了SRGMCMDA在解决数据稀疏性、噪声以及处理线性和非线性特征局限性方面的先进性。
如表8所示,SRGMCMDA通过融合多种先进技术,在保持高预测精度的同时,增强了对复杂生物关联的解析能力。
总之,受前人方法启发,本研究提出了SRGMCMDA方法的基础理论假设:首先,我们假设微生物-药物关联网络存在高阶潜在关联,这些关联可以通过重启随机游走(RWR)捕获。其次,我们进一步假设将注意力机制(如Talking-head Attention)与MLP相结合,能够有效处理异质特征,提高关联预测的准确性。
当前用于微生物-药物关联预测的计算模型常常面临数据稀疏、噪声严重以及线性和非线性特征处理不足等挑战。为解决这些局限性,SRGMCMDA引入了几种创新方法,其总结如表8所示。该模型从采用的技术、预处理方法、数据集类型、评估指标以及优缺点等多个维度进行评估,为微生物-药物相互作用研究提供了全面而强大的计算工具。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号