
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多尺度全局-局部U-Net架构在蛋白质相互作用位点预测中的创新应用
【字体: 大 中 小 】 时间:2025年05月07日 来源:Computational Biology and Chemistry 2.6
编辑推荐:
为解决蛋白质相互作用位点(PPIS)预测中多尺度特征与全局-局部信息融合不足的难题,研究人员开发了基于U-Net框架的MGU-PPIS模型。该模型通过三级池化/反池化操作捕获多尺度特征,结合Transformer、图卷积网络(GCN)和图注意力网络(GAT)同步提取全局上下文与局部结构信息,并引入拉普拉斯位置编码增强蛋白质全局结构表征。实验验证表明,该模型在多个基准数据集上显著超越现有方法,为蛋白质功能分析和药物设计提供了新工具。
蛋白质相互作用(Protein-Protein Interaction, PPI)是生命活动的核心机制,从细胞信号传导到免疫应答都依赖这种精密分子对话。然而,精准定位蛋白质相互作用位点(PPIS)却面临巨大挑战——传统实验方法如质谱联用技术和酵母双杂交系统不仅耗时耗力,更难以捕捉瞬时动态相互作用。虽然计算生物学领域已涌现机器学习、深度学习方法,但现有模型往往顾此失彼:卷积神经网络(CNN)擅长捕捉局部结构却忽视全局拓扑,图神经网络(GNN)虽能建模三维结构却难以整合多尺度特征。这种技术瓶颈严重制约了药物靶点发现和抗体设计的进程。
针对这一关键科学问题,中国研究人员在《Computational Biology and Chemistry》发表的研究中,提出了名为MGU-PPIS的创新模型。该研究通过三级池化/反池化操作的U-Net架构实现多尺度特征提取,在每一尺度上创新性地融合Transformer的全局建模能力与图注意力网络(GAT)、图卷积网络(GCN)的局部特征捕获优势,并引入拉普拉斯位置编码表征蛋白质整体几何特征。采用AGAT-PPIS提供的基准数据集(含Train_335训练集和Test_60等测试集)进行验证,结果显示该模型在预测精度上实现显著突破。
关键技术方法
研究采用三级图池化策略(首层保留50%节点,二层60%,三层40%),在每层集成Graph Transformer模块;使用70个训练周期,Adam优化器(初始学习率0.001)和交叉熵损失函数;通过双层U-Net架构实现特征迭代优化,最终经多层感知机(MLP)输出预测结果。
主要研究结果
结论与意义
该研究开创性地将U-Net架构应用于PPIS预测领域,通过多尺度特征提取和全局-局部信息融合的协同机制,解决了现有方法难以兼顾不同层次结构信息的核心难题。模型在三个独立测试集上均展现稳定优势,特别对蛋白-抗体界面预测准确率突破82%。技术层面,拉普拉斯位置编码与双重U-Net的设计为生物分子结构表征提供了新范式;应用层面,该成果不仅为精准医疗中的靶点筛选提供工具,其多尺度建模思路更可拓展至RNA-蛋白质相互作用预测等领域。研究团队Dangguo Shao、Yuyang Zou等强调,这种架构在未来可整合冷冻电镜数据,有望实现动态相互作用位点的实时预测。
生物通微信公众号
知名企业招聘