基于迁移学习混合注意力的蛋白质相互作用网络预测新方法AttnSeq-PPI

【字体: 时间:2025年10月25日 来源:Biochimica et Biophysica Acta (BBA) - Proteins and Proteomics 2.5

编辑推荐:

  本文提出了一种创新的深度学习框架AttnSeq-PPI,通过融合自注意力(self-attention)和交叉注意力(cross-attention)机制,结合ProtT5大语言模型(LLM)的蛋白质序列嵌入技术,显著提升了蛋白质相互作用(PPI)网络预测的准确性和泛化能力。该模型在多个物种数据集上实现99%的预测精度,为大规模PPI研究提供了高效计算工具。

  
亮点
数据集
本研究使用了三个经过实验验证的PPI数据集进行模型训练和评估:
  • 物种内人类数据集包含36,630个相互作用PPI样本和36,480个非相互作用样本
  • 酵母数据集包含33,479个正样本和同等数量的负样本
  • 多物种数据集整合了六个物种的PPI数据
结果与讨论
我们采用5折交叉验证对三个数据集进行模型训练和评估(表1)。每次迭代中测试集的结果均用于模型评估。此外,四个独立物种数据集和两个网络数据仅用于模型验证。本节展示了所提模型的性能及其与其他方法的比较结果。消融实验结果见第3.5节。t-SNE图可视化分析揭示了特征分布的聚类模式。
结论
本研究重点提升了不同数据集上PPI网络预测的准确性。我们将网络预测问题构建为二分类问题,其中正相互作用蛋白质对标记为1,负相互作用对标记为0。与现有先进方法相比,本模型表现出卓越的竞争力。创新性在于通过混合注意力机制提取蛋白质对的上下文特征,显著提升了模型对未知蛋白质的泛化能力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号