编辑推荐:
本文聚焦冷冻电镜(cryo-EM)蛋白质结构模型质量评估。cryo-EM 虽发展迅速,但解析图谱存在挑战。文中介绍了传统和 AI 评估方法,如 MAP-MODEL 评估、模型质量评估等,还列举实例展示 AI 方法优势,为结构生物学研究提供参考。
1. 引言
冷冻电镜(cryo-EM)在确定蛋白质三维结构方面应用愈发广泛,其分辨率不断提升,2017 - 2024 年,分辨率达 4? 或更好的 cryo-EM 图谱比例从 31% 增至 64%。然而,解释 cryo-EM 图谱以构建精确蛋白质结构仍困难重重。图谱局部分辨率存在差异,低分辨率区域会干扰氨基酸类型和位置的正确确定。而且,缺乏专业知识的研究人员增多,建模错误的概率也随之上升,约 15% 或更多由 cryo-EM 确定的 PDB 结构存在建模误差。
cryo-EM 领域一直重视图谱和结构模型的验证,但 X 射线晶体学的质量评估方法无法直接用于 cryo-EM。cryo-EM 图谱分辨率的定义也不够完善,常用的傅里叶壳层相关(FSC)法,其局部分辨率受多种参数影响。目前,该领域提出了多种图谱和模型验证建议,并开发出众多计算方法,主要分为图谱 - 模型评估和结构模型质量评估两类。近年来,基于人工智能(AI)的方法开始涌现,本综述将探讨 cryo-EM 中不同类型的验证方法,并举例说明 AI 评估方法的实际应用。
2. 图谱 - 模型评估方法
图谱 - 模型评估方法用于评估结构模型与实验图谱的契合度。传统方法通过计算图谱与结构模型模拟图谱的互相关来全局评估模型拟合度,如 TEMPy、CCP-EM 和 Phenix 等软件都包含此类评估程序。TEMPy 能提供基于互相关、互信息的分数以及评估表面模式差异的指标;CCP-EM 使用 TEMPy 包计算基于互相关的分数,还包含错误发现率(FDR)骨干分数、FSC 和平均 FSC(FSCavg);Phenix 则通过 FSC 在实空间和傅里叶空间提供图谱 - 模型相关性。
近年来,出现了局部图谱 - 模型拟合分数,如 EMRinger、Q 分数和 FSC-Q。EMRinger 评估模型中每个残基的侧链构象与 cryo-EM 图谱的一致性;Q 分数通过将每个原子周围的密度分布与理想高斯参考分布比较,定量评估 cryo-EM 图谱中单个原子的可分辨性;FSC-Q 利用局部 FSC 计算 cryo-EM 图谱与原子模型之间的局部分辨率差异,通过比较图谱和模型的局部分辨率来确定 FSC-Q 分数,该分数可反映原子在图谱中的支持程度。
3. 模型质量评估方法
模型质量评估方法用于识别结构模型中的几何异常值,不考虑模型与 cryo-EM 图谱的契合度。常见的模型质量评分方法包括 Molprobity 和 CaBLAM。Molprobity 常用于评估原子模型质量,并被纳入 wwPDB 验证报告,它能报告多种结构质量指标,如原子间的空间重叠、评估骨干扭转角的 Ramachandran 图、侧链旋转异构体、键长和键角异常值等,并给出一个综合质量分数。CaBLAM(基于 Cα 的低分辨率注释方法)则评估蛋白质结构的骨干几何形状,通过两个 Cα 伪二面角和另一个连接羰基氧的二面角来检测 Cα 几何形状的异常值,与仅评估单个残基扭转角的 Ramachandran 图不同,它能评估多个连续的 Cα 原子以识别潜在的局部骨干构象错误。
此外,AlphaFold2(AF2)的预测局部距离差异测试(pLDDT)分数也值得关注,它为 AF2 预测的结构模型提供每个残基的置信水平。但 pLDDT 分数与传统模型质量评估分数概念不同,传统分数评估相对于已知结构统计的统计异常值,而 pLDDT 预测模型中每个残基周围局部 Cα 原子与假设正确结构的一致性。
4. 基于 AI 的质量评估方法
近年来,许多基于 AI,尤其是深度学习的工具被开发用于 cryo-EM 数据处理的不同阶段,质量评估也不例外。深度学习的优势在于能捕捉 cryo-EM 图谱中原子、氨基酸、核苷酸或其他结构的局部密度分布模式。
在局部图谱分辨率估计方面,DeepRes 是首个应用深度学习的方法,它利用卷积神经网络(CNN)对从 PDB 中原子蛋白质结构生成的模拟图谱的局部密度进行训练,但由于训练数据为模拟图谱,在真实实验数据上的性能可能欠佳。Avramov 等人提出的 3D U-Net 架构在实验图谱上进行训练,能将体素分类到十个分辨率区间,与传统方法结果相近。CryoRes 同样使用 3D U-Net 架构,可估计全局和局部图谱分辨率,并识别蛋白质区域(掩码),其全局分辨率预测与 EMDB 报告的分辨率对齐,局部分辨率预测与体素级局部分辨率估计方法 ResMap 的输出匹配,且适用于子断层平均图谱。这些基于深度学习的方法无需像传统 FSC 方法那样需要半图谱或掩码,使用相对简便,但不同方法估计的局部分辨率虽大致相符,但一致性欠佳。
在图谱 - 模型评估方面,DeepQs 使用 3D 视觉 Transformer(ViT)网络架构,可在无需原子结构模型的情况下,估计高达 5? 分辨率的 cryo-EM 密度图谱中局部位置的 Q 分数。该网络将密度图谱分割成 3D 补丁,利用 Transformer 模型学习补丁间关系,从而捕捉 3D 图像的局部和全局特征。其优势是无需原子详细结构模型和半图谱即可估计 Q 分数,但预测的 Q 分数与实际值在绝对值上并不总是一致。
MEDIC(冷冻电镜模型错误检测)用于识别中等分辨率(3 - 5?)cryo-EM 图谱构建的蛋白质结构模型中的局部骨干错误。它通过逻辑回归结合多种相关特征,包括局部互相关、Rosetta 能量函数中的键角和键长能量项,以及另一种深度学习方法预测的每个氨基酸的局部结构质量(pLDDT 分数),输出每个残基的错误概率。该方法能检测多种建模错误,但对内在柔性区域和低密度支持区域容易产生误判。
DAQ(基于深度学习的氨基酸质量评分)用于评估 2.5 - 5? 分辨率 cryo-EM 图谱构建的蛋白质结构模型中残基水平的局部模型质量。它利用 3D U-Net 网络捕捉蛋白质模型中原子和残基周围的局部密度模式,计算原子和残基在图谱中所处位置的概率,能识别结构模型中氨基酸分配错误,在识别残基位置不一致方面表现出色。DAQ 分数已计算并存储在 DAQ-Score 数据库中,该数据库每月更新,目前包含超过 228,000 个蛋白质链模型,并且 DAQ 分数也可在 Protein Data Bank Japan(PDBj)的条目页面获取,已被越来越多的实验结构生物学家采用。不过,当前版本的 DAQ 仅适用于蛋白质模型,未考虑核酸、配体等其他分子,且评估基于残基,缺乏原子级别的详细评估。
5. 基于 AI 的蛋白质模型优化和质量评估示例
以人类线粒体 AAA + 蛋白质 LONP1 链 C(PDB ID:7KSM)的结构模型为例,该模型由分辨率为 3.2?(EMD-23020)的 EM 图谱构建,有两个版本,初始模型和修订模型在残基 323 - 332 处序列注册存在差异。
使用 CryoRes 估计图谱局部分辨率,范围在 2.97?(蓝色)至 4.25?(红色)之间。对残基 323 - 332 的连接区域和分辨率最低的残基 371 - 380 区域进行放大观察,发现连接区域局部分辨率约为 3.4?,略低于全局分辨率。DAQ (AA) 和 DAQ (Cα) 分数在连接区域均为负值,且 DAQ (AA) 更负,表明可能存在序列注册错误;Q 分数分析显示该区域质量下降;MEDIC 显示该区域错误概率接近 1.0。
针对这些问题,采用 DAQ-Refine 算法对模型进行优化。DAQ-Refine 利用定制的 AF2 和 Rosetta Relax 协议调整低 DAQ 分数的局部结构区域,调整后序列移动了三个残基,DAQ (AA) 和 DAQ (Cα) 分数均提升为正值,Q 分数从 0.43 提高到 0.61,MEDIC 错误概率从 1.0 降至接近 0。
此外,MEDIC 在初始模型的其他约 10 个区域也显示出中到高的错误概率,优化后显著降低,但残基 371 - 380 区域的错误概率在优化后仍高达 1.0 左右。这是因为 MEDIC 会对低密度区域进行惩罚,而 DAQ 分数在该区域为正值,表明其能通过考虑周围密度模式,更准确地判断该区域结构的正确性。该示例表明,结合基于 AI 的检测和优化方法在结构生物学研究中非常有效。
6. 讨论
AI 方法,特别是深度学习的出现,为 cryo-EM 方法的发展带来了重大进步。基于 AI 的工具已应用于 cryo-EM 结构确定的几乎每个步骤,包括质量评估,如 DAQ 评估已被纳入 PDBj 条目,受到越来越多的认可和应用。
基于 AI 的质量评估方法的主要优势在于能自动识别特定原子或结构类型在给定分辨率下的局部密度分布模式,这是传统评分函数难以做到的。然而,这些方法也存在局限性,它们依赖训练数据集,训练数据中未涵盖的分子,如核酸、配体或水分子,在评估新的 cryo-EM 图谱时将不会被考虑。而且,训练数据的质量会影响评估的准确性,例如 PDB 中错误的结构模型会对训练后的评估方法性能产生负面影响。因此,在使用基于 AI 的工具时,需要充分了解其优缺点,合理应用。