DCMF-PPI:基于动态条件与多特征融合的蛋白质相互作用预测新框架
《BMC Bioinformatics》:DCMF-PPI: a protein-protein interaction predictor based on dynamic condition and multi-feature fusion
【字体:
大
中
小
】
时间:2025年10月17日
来源:BMC Bioinformatics 3.3
编辑推荐:
本文提出了一种创新的蛋白质相互作用(PPI)预测框架DCMF-PPI,通过整合动态建模(ENM/NMA)、多尺度特征提取(PortT5、PSSM、DSSP等)和概率图表示学习(VGAE),有效解决了传统方法忽略蛋白质动态特性及数据不足的局限性。实验表明,该模型在多个基准数据集上显著提升了预测精度(AUC/AUPR),为系统生物学和药物发现提供了可靠工具。
蛋白质作为生命活动的主要执行者,通过蛋白质相互作用(PPI)构成高度有序的分子网络,在信号转导、代谢调控等生命过程中起关键作用。传统实验方法如酵母双杂交(Y2H)和亲和纯化质谱(AP-MS)成本高昂,而现有计算方法多将蛋白质视为静态实体,忽略了其在细胞过程中的动态特性(如构象变化和结合亲和力差异),且缺乏全面的蛋白质数据支持。
- 1.PortT5-GAT模块:利用蛋白质语言模型PortT5提取残基级特征,结合图注意力网络(GAT)捕捉蛋白质相互作用中的上下文感知结构变化。通过弹性网络模型(ENM)生成多个时间点的动态邻接矩阵,模拟蛋白质在不同运动模式下的结构波动。
- 2.MPSWA模块:采用并行卷积神经网络结合小波变换,从六类残基特征(PSSM、DSSP、原子特征、理化性质、动态坐标和One-Hot编码)中提取多尺度特征。其中,通过正态模式分析(NMA)获取Cα原子在五个构象中的坐标变化(15维向量),首次将小波变换用于动态特征分析,增强了对蛋白质运动频率特征的捕捉。
- 3.VGAE模块:通过变分图自编码器学习概率潜在表示,对PPI图结构进行动态建模。编码器使用三层图卷积网络(GCN)融合节点特征和边属性,解码器通过点积重构PPI网络,利用KL散度优化潜在分布与标准高斯分布的一致性。
蛋白质图结构以残基为节点(Cα原子间距<10?建立边),ENM通过基尔霍夫矩阵特征分解生成多个运动模式的变形结构,构建时序邻接矩阵。NMA提取的低频模态(前10个非平凡模态)通过线性组合生成构象,计算残基坐标位移作为动态输入特征。小波注意力机制(Daubechies 4基函数)将特征分解为高频和低频信号,突出与相互作用相关的稳定动态行为。
在SHS27k、SHS148k和酵母数据集上的测试显示,DCMF-PPI在随机、BFS和DFS分区策略下均优于传统方法(SVM、RF)和深度学习模型(DPPI、PIPR等)。例如,在BFS分区下,DCMF-PPI的F1-score较GNN-PPI提升13.5%(SHS27k)和10.6%(SHS148k)。对未知蛋白质(ES/NS场景)的预测中,模型在BFS分区下对NS样本的F1-score达77.25%,显著优于对比模型。消融实验验证了VGAE、动态邻接矩阵和坐标特征的贡献,移除任一组件均导致性能下降(如无VGAE时随机分区F1-score降低3%)。小波注意力机制较标准自注意力提升显著(SHS148k数据集中随机分区F1-score提升12.21%),频率分析显示其有效分离噪声与生物相关特征。
DCMF-PPI通过多特征融合与动态建模的协同,解决了PPI预测中的静态局限性。动态坐标特征和时序邻接矩阵虽依赖计算模拟(非实验数据),但有效捕捉了构象灵活性。未来可整合实验验证的动态数据进一步提升精度。该框架为研究动态生物过程(如信号通路调控)和药物靶点发现提供了新思路。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号