基于图Transformer与等变图神经网络的蛋白质相互作用位点预测模型GTE-PPIS的创新研究

【字体: 时间:2025年06月18日 来源:Briefings in Bioinformatics 6.8

编辑推荐:

  为解决蛋白质相互作用位点(PPI sites)预测精度不足的问题,中国石油大学(华东)团队开发了融合图Transformer(GT)与等变图神经网络(EGNN)的双分支模型GTE-PPIS。该模型通过协同提取全局拓扑特征与局部几何结构,在多个基准数据集上显著超越现有方法(AUROC达0.873,AUPRC提升6.4%),为生物网络图谱构建和药物设计提供了新工具。

  

蛋白质作为生命活动的核心执行者,其相互作用网络是理解细胞功能的关键。然而,传统实验方法如酵母双杂交耗时费力,而现有计算预测工具在精度和泛化能力上仍有局限。尤其当面对复杂的三维空间构象和长程相互作用时,如何准确捕捉蛋白质界面残基的特征成为重大挑战。中国石油大学(华东)的Tao Song团队在《Briefings in Bioinformatics》发表的研究,通过创新性地融合几何感知与全局注意力机制,为这一领域带来了突破性进展。

研究团队开发了GTE-PPIS预测系统,其核心技术在于:1) 构建包含进化特征(PSSM/HMM)、结构特征(DSSP)和原子属性(AF)的61维节点特征;2) 采用等变图神经网络(EGNN)处理三维坐标更新,通过10层EGCL实现旋转平移不变的几何学习;3) 并行使用4头注意力机制的图Transformer捕捉长程依赖;4) 通过残差连接缓解过平滑问题。模型在Train_334/Test_60等数据集上训练,采用五折交叉验证策略。

模型架构分析
通过系统消融实验验证了双分支设计的必要性:移除EGNN导致AUPRC下降15.3%,而缺失GT分支使AUROC降低8.8%。如图1所示,EGNN模块通过式(4)-(6)实现坐标等变更新,而GT模块通过式(9)-(13)的多头注意力整合边缘特征。

特征贡献评估
如表5所示,原子特征(AF)对模型性能影响最大,其缺失使AUPRC骤降至0.481。进化特征(PSSM)和二级结构特征(DSSP)分别贡献了15.3%和8.4%的AUPRC提升。图2-3的箱线图进一步显示,DSSP特征能显著稳定模型预测波动。

性能比较
在Test_60数据集上(表2),GTE-PPIS以0.873的AUROC和0.611的AUPRC超越所有对比方法。特别是对金黄色葡萄球菌蛋白6LKI的案例研究(图4)显示,其假阳性预测比AGAT-PPIS减少43.9%(105 vs 187),验证了模型的高特异性。

该研究的创新性体现在三个方面:首先,首次将等变学习引入PPI预测,通过式(5)的坐标传播规则保持几何一致性;其次,开发了融合边缘特征的注意力机制(式10),有效建模残基间角度关系;最后,提出的双分支架构解决了传统GNN难以兼顾局部几何与全局拓扑的难题。尽管当前模型对超长序列(>800残基)的处理存在硬件限制,但其在未结合态数据(UBtest_25)上仍保持0.343的AUPRC,显示出良好的临床转化潜力。这项成果不仅为蛋白质相互作用研究提供了新范式,其几何感知框架也可拓展至蛋白质-药物相互作用预测等领域。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号