
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:深度学习在蛋白质-蛋白质相互作用中的最新进展:综述
【字体: 大 中 小 】 时间:2025年06月17日 来源:BioData Mining 4
编辑推荐:
这篇综述系统梳理了2021-2025年深度学习(DL)在蛋白质-蛋白质相互作用(PPI)预测中的突破性进展,重点分析了图神经网络(GNN)、卷积神经网络(CNN)、注意力机制(如Transformer)等核心技术的创新应用,并探讨了多任务学习、迁移学习(如BERT/ESM模型)及自编码器在解决数据稀疏性和动态交互挑战中的潜力。文章为计算生物学和人工智能交叉领域的研究者提供了技术参考与发展方向。
人工智能(AI)驱动的深度学习技术正重塑蛋白质-蛋白质相互作用(PPI)的研究范式。PPI作为细胞信号传导、转录调控等生命活动的核心调控者,其预测精度直接影响疾病机制解析和药物开发。传统实验方法如酵母双杂交(Y2H)和质谱技术虽可靠但耗时,而早期计算方法依赖手工特征提取,难以应对复杂生物系统。深度学习凭借自动特征提取和高维数据处理能力,成为PPI研究的变革性工具。
图神经网络(GNN)
GNN通过消息传递机制捕捉蛋白质结构的局部与全局特征。例如,Yang等开发的AG-GATCN框架整合图注意力网络(GAT)与时序卷积(TCN),有效抵抗噪声干扰。Zheng等提出的GSALIDP模型结合GraphSAGE与长短期记忆网络(LSTM),成功预测无序蛋白(IDP)的动态相互作用。
卷积神经网络(CNN)
3D-CNN在空间特征建模中表现突出。Guo等基于RepVGG开发的TRScore模型,无需额外特征即可精准识别蛋白质对接构象。Chen等引入旋转不变的Eq.3DCNN,显著提升对蛋白质构象变化的鲁棒性。
循环神经网络(RNN)
LSTM-PHV模型通过词嵌入(word2vec)将氨基酸序列转化为语义向量,实现了人类-病毒PPI的高精度预测。RAPPPID则采用双重AWD-LSTM网络,结合正则化技术解决数据偏差问题。
注意力机制与Transformer
自注意力模块(如SDNN-PPI)通过动态权重分配解析残基级长程依赖。Transformer架构(如MaTPIP)融合预训练语言模型(PLM),在跨物种PPI预测中AUPR达56.6。Wang等首次将点云神经网络(PointNet)应用于蛋白质-配体结合亲和力预测,相关系数Rp
达0.827。
多模态与迁移学习
Kang等开发的AFTGAN整合结构预测与迁移学习,Micro-F1达0.867。AlphaBridge框架利用AlphaFold3的pLDDT和PAE指标,精准解析蛋白质-核酸复合物界面。
数据挑战与解决方案
针对数据不平衡,生成对抗网络(GAN)生成合成样本优于传统过采样(SMOTE)。动态PPI预测需结合时空建模,如MuToN框架通过几何注意力网络量化突变对结合界面的影响(Spearman相关性0.62)。
非模式生物PPI预测和罕见互作识别仍是难点,需发展自监督学习(如SMG框架)和跨物种迁移技术。多维交互策略(序列-结构-微环境融合)将推动精准医疗发展,如DeepTraSynergy模型已实现抗癌药物协同效应预测(AUC-ROC 0.8637)。
(注:全文技术细节与数据均源自原文,未新增结论)
生物通微信公众号
知名企业招聘