基于深度学习的肽结构预测算法比较分析:揭示性能差异与结构特征影响

【字体: 时间:2025年10月09日 来源:Proteins: Structure, Function, and Bioinformatics 2.8

编辑推荐:

  本文系统比较了AlphaFold2(AF2)、RoseTTAFold2(RF2)和ESMFold(ESMF)三种深度学习算法在肽类三维结构预测中的性能。研究发现,尽管所有方法都能产生高质量模型,但其整体表现低于蛋白质结构预测水平。研究首次量化了肽长度、二硫键数量、二级结构类型和构象多样性(lDDTNMR)等结构特征对预测精度(GDT_TS)和置信度(plDDT)的影响,并揭示了多序列比对(MSA)质量对AF2/RF2预测准确性的关键作用。该研究为肽结构预测的工具选择和算法优化提供了重要指导。

  
1 引言
肽类化合物在生物医学领域展现出多样化的生物活性和治疗潜力,涉及血糖调节(胰岛素)、神经系统功能(神经肽)和免疫应答(抗菌肽)等关键生理过程。尽管其重要性日益凸显,但针对肽类三维结构预测的专用工具仍然相对缺乏。近年来,深度学习技术推动了蛋白质结构预测领域的革命性进展,AlphaFold2(AF2)、RoseTTAFold2(RF2)和ESMFold(ESMF)等算法能够以接近实验精度的水平预测蛋白质结构。本研究旨在系统评估这些新兴方法在肽类三维结构预测中的性能表现,并深入分析影响预测准确性的关键结构因素。
2 结果
2.1 肽数据集
从蛋白质数据库(PDB)的230,000余个实验结构中筛选出630个具有代表性的可溶性单体肽,其中574个在算法训练截止日期前沉积(训练前数据集),56个在截止日期后沉积(训练后数据集)。该数据集涵盖了10-50个氨基酸残基的天然肽序列,排除膜蛋白和非标准残基修饰的肽类。
2.2 预测方法一致产生高质量模型
对训练后数据集的56个肽进行预测显示,AF2表现出最佳整体性能,平均GDT_TS为69.75,中位数71.92,紧随其后的是ESMF(平均68.59)和RF2(平均66.52)。虽然所有方法都能产生与实验结构相媲美的高质量模型,但Wilcoxon符号秩检验未显示算法间存在显著差异。Spearman相关性分析显示算法间存在强相关性(AF2与RF2的ρ=0.817,AF2与ESMF的ρ=0.792),表明所有算法对特定序列集都能产生高质量预测。
训练前后数据集的比较揭示重要发现:对于训练前数据集,AF2和RF2的GDT_TS中位数显著提高(分别增加9.24和13.44个单位),表明训练数据可能存在轻微偏差。ESMF的结果则无显著差异,这可能与其训练过程中对短序列的筛选策略有关。
2.3 plDDT与lDDT-Cα评分相关性
研究评估了预测置信度指标plDDT与实验结构质量指标lDDT-Cα的相关性。最小二乘线性拟合显示三者均具有良好的相关性,其中AF2表现出最佳拟合特性(斜率0.916,截距+3.850)。密度分布图显示,高质量预测(高平均lDDT-Cα)往往显示略低的plDDT值,而低质量预测(平均lDDT-Cα<50)则经常出现plDDT高于lDDT-Cα的情况。
2.4 肽结构特征对预测性能的影响
2.4.1 肽长度影响
肽序列长度对所有算法的预测影响有限。较长肽(30-39残基)通常显示较高的平均GDT_TS分数,但仅在RF2中观察到10-19与30-39残基范围间的显著差异。在plDDT评分方面,AF2对所有长度范围的肽都表现出更高的置信度,而RF2对较短肽(10-19残基)的置信度分配存在困难。
2.4.2 二级结构影响
随机卷曲(RC)肽的GDT_TS和plDDT中位数显著低于具有注释二级结构的肽(螺旋-H,折叠片-S或混合螺旋和折叠片-H+S)。在结构化肽中,纯螺旋肽的评分低于纯折叠片或混合结构肽。AF2对所有二级结构类型都表现出最高的置信度,而ESMF在含β折叠片的肽中表现较差。
2.4.3 环化影响
针对320个含二硫键的肽,研究发现AF2的预测与实验观察到的二硫键最为一致。所有算法中,具有两个或更多二硫键的肽均获得显著高于线性肽的GDT_TS分数。含三个二硫键的肽也比单二硫键肽获得更好评分。在plDDT值方面,预测对含二硫键的肽表现出更高置信度,这种效应在含四个或更多二硫键的肽中尤为明显。
2.4.4 肽构象多样性影响
使用lDDTNMR(所有NMR模型间计算的平均lDDT-Cα)作为肽构象多样性指标,研究发现高构象多样性(lDDTNMR<70)的肽 consistently表现出较低的GDT_TS和平均plDDT分数。当lDDTNMR阈值高于80时,GDT_TS或plDDT分数几乎无统计差异。AF2在所有构象多样性类别中持续显示最高置信度。
2.5 结构特征与评分间的关系
研究发现二硫键数量与β折叠片比例呈中等正相关(r=0.51),残基数量与二硫键数量(r=0.37)和折叠片比例(r=0.34)呈弱正相关。螺旋比例与折叠片比例呈中等负相关(r=-0.45)。各种GDT_TS评分和平均plDDT值与lDDTNMR、折叠片比例和二硫键数量呈轻微正相关(0.13≤r≤0.43)。
2.6 预测示例
2.6.1 高质量预测
鉴定出93个AF2、RF2和ESMF的GDT_TS评分均≥90的肽,这些肽主要具有以下特征:长度30-39残基,富含二硫键(至少三个/肽),低构象多样性(lDDTNMR≥80)和明确二级结构。如6BUC(螺旋结构,三个二硫键,lDDTNMR=91.02)和1Q2K(α螺旋和β折叠片,三个二硫键,lDDTNMR=89.29)的预测结构与NMR模型高度吻合,全局距离计算(GDC)评分显示侧链建模也十分精确。
2.6.2 不准确预测
44个低GDT_TS(<50)和plDDT(<70)分数的肽主要表现为线性、高度柔性、常采用α螺旋或未定义二级结构。如2MZ7(40-50残基,三个短螺旋,无二硫键,lDDTNMR=52.25)被预测为无结构延伸线圈;7WE3(40-50残基,三个二硫键,高柔性)虽然二级结构预测正确,但胱氨酸残基位置与实验结构不兼容。
2.6.3 GDT_TS与平均plDDT分数间的高差异
通过z分数比较发现,大多数预测具有一致的GDT_TS和平均plDDT分数,但存在少量不一致情况。9-10个案例显示算法低估了预测质量(plDDT z分数<< GDT_TS z分数),而24-27个案例显示算法高估了预测质量(plDDT z分数>> GDT_TS z分数)。
2.6.4 低质量预测但高plDDT分数
典型案例如1HJ0(大型线性α螺旋肽)被预测为延伸无构象 conformation,所有预测均显示高置信度(plDDT 81.68-84.59),但未能正确建模两个螺旋间的短环区域。类似错误也出现在8PWT等肽中,表明算法在检测和建模连续螺旋间的短结构转换(环、弯曲、转角)方面存在持续困难。多脯氨酸螺旋1SUT的所有模型都错误地预测为延伸无构象,未能捕获实验结构中脯氨酸诱导的转角。
2.6.5 高质量预测但低plDDT分数
少数肽存在预测准确性高但平均plDDT分数低的情况,如速激肽神经激肽A(1N6T)被AF2和RF2以高精度但低置信度预测,未能发现明确的共同结构模式,表明存在算法特定的预测自评估困难。
2.7 MSA深度对AF2和RF2预测的影响
6CKF和7YRW具有相似结构特征(30-39残基,螺旋结构,三个二硫键),但预测准确性差异显著。6CKF获得高质量预测(GDT_TS>95),其MSA丰富(AF2>1000条序列,RF2>8000条序列);而7YRW预测质量差(GDT_TS<50),其MSA浅薄(AF2仅3条,RF2仅2条)。Neff值(MSA质量指标)分析显示,AF2在0-1与100+ Neff范围间存在显著差异,表明MSA质量对预测准确性具有重要影响。当MSA质量极差时,ESMF等基于序列的方法可能产生与MSA基于方法相当质量的预测。
3 讨论
本研究首次全面评估了主流深度学习算法在肽类结构预测中的性能。结果显示,AF2整体表现最佳,但其性能相比蛋白质结构预测下降超过12个GDT_TS点,特别是在柔性肽的预测方面。训练数据可能存在轻微偏差,训练后数据集的预测质量较低表明算法仍有改进空间。
肽的结构特征显著影响预测性能:更大、更结构化、更多二硫键环化和更高构象稳定性(高lDDTNMR)的肽往往获得更好预测。这些稳定肽与训练数据中的蛋白质样结构特征相似,解释了为什么低构象多样性的肽比高构象多样性的肽获得更好预测。
MSA质量对AF2和RF2的预测准确性具有关键影响。肽序列较短限制了MSA的覆盖度和深度,从而限制了从MSA中提取残基间空间关系信息的能力。对于MSA质量差的肽,ESMF等基于序列的方法可提供有价值的替代方案。
研究建议在实践中采取多种策略提高预测质量:生成多个预测模型、使用不同算法、增加循环次数、分析MSA质量,并结合能量函数和结构验证程序进行外部评估。未来改进方向包括:针对短序列优化比对参数、使用高质量肽NMR结构进行专门训练,以及采用MSA聚类等新技术来预测替代构象。
4 材料与方法
4.1 肽数据集构建
使用MMSeqs2对PDB中的所有链进行聚类(相似度阈值70%),筛选出10-50个残基的溶液NMR解析的单体蛋白结构,排除膜蛋白和非标准残基。最终数据集包含630个结构,分为训练前(574个)和训练后(56个)数据集。
4.2 三维肽结构预测算法
评估AF2(v2.3.2)、RF2(v1.0)和ESMF(v1.0)三种主流算法。AF2和RF2基于MSA提取进化耦合信息,ESMF直接基于序列预测。
4.3 结构预测设置
使用特定版本的序列和结构数据库(BFD、MGnify、UniRef等),AF2生成5个结构选择排名第一的模型,RF2和ESMF各生成1个预测。
4.4 使用GDT_TS评估预测准确性
采用局部全局比对(LGA)算法计算GDT_TS,>90表示实验精度可比,>70表示高精度,<50表示预测失败。对高质量预测还计算了全局距离计算(GDC)以评估侧链建模质量。
4.5 使用plDDT进行预测准确性自评估
分析平均plDDT与实验lDDT-Cα的相关性,>90表示高可靠性,>70表示主干正确但部分侧链错误放置,<50表示不可靠预测。
4.6 结构特征对预测准确性的影响
根据二硫键数量、序列长度、二级结构类型和构象多样性(lDDTNMR)对肽进行分类,使用Kruskal-Wallis H检验和Dunn's事后检验进行统计比较。
4.7 评估预测一致性
通过z分数比较平均plDDT和GDT_TS,识别过度自信(plDDT z分数>> GDT_TS z分数)和自信不足(GDT_TS z分数>> plDDT z分数)的预测。
4.8 MSA质量及其对预测准确性的影响
使用有效序列数(Neff)量化比对多样性,分析Neff与GDT_TS的关系,比较无MSA时AF2/RF2与ESMF的性能差异。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号