基于双特异性学习与层级信息融合的蛋白质相互作用预测新方法HI-PPI

【字体: 时间:2025年08月05日 来源:BMC Biology 4.5

编辑推荐:

  针对现有蛋白质相互作用(PPI)预测方法在层级关系建模和交互特异性学习方面的不足,南京邮电大学陶唐团队联合湖南大学等单位提出HI-PPI模型。该研究通过双曲空间图卷积网络(HGCN)编码PPI网络的层级结构,结合门控交互网络实现交互特异性学习,在SHS27K和SHS148K数据集上Micro-F1提升2.62%-7.09%,为药物靶点发现提供了新工具。

  

在生命科学领域,蛋白质相互作用(PPI)网络如同城市交通网般错综复杂,其精准预测对理解疾病机制和药物开发至关重要。然而,现有计算方法面临两大瓶颈:一是难以捕捉蛋白质网络固有的层级结构(如核心蛋白与边缘蛋白的差异),二是忽视蛋白质对的独特交互模式。这就像试图用平面地图导航立体交通——传统图神经网络(GNN)虽能处理节点关联,却无法有效表征生物系统中普遍存在的层级关系。

针对这一挑战,南京邮电大学现代邮政学院陶唐团队联合湖南大学等单位在《BMC Biology》发表研究,提出创新性解决方案HI-PPI(基于双曲图卷积网络和交互特异性学习的PPI预测模型)。该研究突破性地将双曲几何引入PPI网络建模,使蛋白质的层级地位通过其嵌入向量与双曲空间原点的距离自然显现;同时设计门控机制动态调控蛋白质对的交互信息流,实现"全局层级"与"局部交互"的双重特异性学习。实验表明,该模型在标准数据集SHS27K上Micro-F1达79.57%,较现有最优方法提升5.28%,且能稳定识别仅占1.85%的翻译后修饰(ptmod)类稀有相互作用。

关键技术方法包含:1) 基于AlphaFold2预测结构的异质图编码;2) 超球面模型(Hn)中的曲率自适应双曲GCN;3) 门控交互网络实现Hadamard乘积的特征筛选;4) 采用BFS/DFS策略构建训练-测试集。研究使用1690-5189个人类蛋白质组成的两个数据集,通过5次重复实验验证稳定性。

【层级信息增强的双曲空间建模】

通过将PPI网络映射到曲率为-1/K的双曲空间,蛋白质的层级属性被量化为嵌入向量到原点的距离(如核心蛋白ENSP00000215832距离为1.56,显著小于边缘蛋白的42.0)。相关性分析显示,该距离与接近中心性的相关系数达-0.6504,远高于节点度数的0.3005,证实双曲距离能更准确反映蛋白质的生物学地位。

【交互特异性学习的门控机制】

相比传统注意力机制,研究设计的门控向量g=sigmoid(W·[xi||xj])通过元素级乘积动态过滤噪声,使稀有相互作用预测的F1-score提升20%-100%。在SHS27K测试集上,涉及1000个以上残基的长蛋白质仅导致0.0213的Micro-F1下降,显示模型对输入质量的强鲁棒性。

【多维度性能验证】

在扰动测试中,随机删除80%边时模型性能仅降低0.25,显著优于对比方法。特别值得注意的是,该方法成功识别出12个PTM相关蛋白簇(如group 5中的ENSP00000254654等),这些蛋白在双曲空间可视化中呈现明显的层级聚集特征。

该研究的突破性在于首次将双曲几何与交互特异性学习结合,不仅解决PPI预测的精度瓶颈,更开辟了生物网络层级解析的新范式。作者指出,当前模型对孤立蛋白质对的预测仍存局限,未来可通过融合非图模型进一步提升。这项成果为精准医疗时代的靶向药物设计提供了重要工具,其双曲空间建模思路对社交网络、推荐系统等领域亦有启示意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号