综述:电子顺磁共振光谱法表征构象异质蛋白质

【字体: 时间:2025年05月07日 来源:Current Opinion in Structural Biology 6.1

编辑推荐:

  本文聚焦构象异质蛋白质研究,阐述了 AlphaFold 模型对传统 Anfinsen 范式的挑战。介绍位点定向自旋标记结合电子顺磁共振(SDSL-EPR)技术,通过连续波 EPR、距离分布测量等获取蛋白质结构动力学信息,为理解蛋白质功能提供依据。

  

引言


在过去五十年,结构生物学受 Anfinsen 范式主导,该范式试图用单一构象代表蛋白质。然而,AlphaFold 的出现对其发起挑战。AlphaFold 能提供 1D 每残基预测局部距离差异测试(pLDDT)和 2D 残基对预测对齐误差(PAE)这两个关键不确定性估计。分析 pLDDT 发现,不确定性主要源于蛋白质的真实无序状态,而非 AlphaFold 预测折叠结构域的能力限制。PAE 矩阵显示,大多数人类蛋白质包含固有折叠区域(IFRs)和固有无序区域(IDRs)。例如 SRSF1 蛋白,可表示为D141F941D1182F1992D2483,其中 D 代表无序区域,F 代表折叠区域,上下标分别表示结构域编号和该结构域的最后一个残基。计算 100 种随机选择的人类蛋白质的 Cα-Cα距离 95% 置信区间分布,其中位数为 13 ?,表明 Anfinsen 范式存在显著局限性。

位点定向自旋标记结合电子顺磁共振光谱(SDSL-EPR)可用于评估蛋白质的构象异质性。SDSL-EPR 适用于研究 IDRs,包括在细胞环境中的研究。双电子 - 电子共振(DEER,也称为 PELDOR)可测量距离分布,用于表征蛋白质结合诱导的构象变化或生成集合模型。通常,表征构象异质蛋白质需要采用综合方法。

连续波 EPR 提供的信息


连续波(CW)EPR 是 SDSL-EPR 中的主要实验技术,可在生理过程的温度范围内应用。在流体环境中,CW EPR 能提供硝基氧自旋标记的重新取向动力学信息。由于 IDRs 中骨干动力学增强,其自旋标记的重新取向速度比 IFRs 更快。因此,CW EPR 可检测无序到有序的转变。

例如,利用硝基氧 CW EPR 光谱对骨干动力学的敏感性,检测到蛋白质 CooA(P72322,D51F1331D1352F2182D2223)在结合 CO 后发生的变构变化,CO 的结合激活了其 DNA 结合功能。同样的方法发现,2 型分泌系统蛋白 XcpH 在与其他三种蛋白质形成内膜尖端时仍保持灵活性。天然肽 / 蛋白质抑制剂 IA3(P01094)与酵母天冬氨酸蛋白酶 A 结合时,由 N 端 IFR 和 C 端 IDR(D21F361D682)组成,通过分析其 CW EPR 光谱中硝基氧的旋转相关时间,并转换为局部翻滚体积 VL,可衡量 IDR 的局部压缩程度,还通过用螺旋诱导溶剂 2,2,2 - 三氟乙醇(TFE)滴定进一步研究。

自旋标记位点扫描,即测量一系列在不同残基处带有自旋标记的突变体的 CW EPR 光谱,能提供丰富的蛋白质结构和动力学信息。如对 SNAP25(P60881,D81F801D1312F2012D2063)的两个 SNARE 基序进行位点扫描,揭示了 SN1(F1)的硝基氧动力学梯度,N 端运动较慢,而 SN2(F2)则没有。尽管 AlphaFold 预测它们为 IFRs,但二者在溶液中主要是无序的。

使用自旋探针 TEMPOL 可研究冷冻时蛋白质 - 溶剂的耦合动力学,揭示了 α- 突触核蛋白(P37840,D601F951D1402)在淀粉样原纤维中 D2结构域的可压缩溶剂化壳在水熔点以下仍保持高流动性。快速扫描 EPR 测量可将光谱的信噪比(SNR)提高 5 倍,有助于克服低信噪比的限制,特别是在监测结合事件的动力学或细胞系统中。

距离分布测量提供的信息


DEER 技术可提供标记之间的距离分布,但需要在动力学受抑制的冷冻样品中进行。单分子荧光能量转移(smFRET)实验可在环境温度下的液体溶液中进行,但分布宽度常受散粒噪声主导,只能推断平均距离。因此,通过 DEER 距离分布研究排列无序的程度更合适,而 smFRET 更适合分析 IFRs 排列的动力学。距离分布相当于将构象能量超曲面投影到集体坐标(两个残基之间的距离)上,类似于平均力势,能直接反映集合宽度。

在 IFRs 中,距离分布的宽度通常受自旋标记的几种旋转异构体的影响,尽管不能排除 IFR 内柔性结构元件的贡献。例如,对人类 Akt1 激酶(P31749,F1201D1431F3002D3062D4443F4803)的研究,利用五个距离分布进行多边测量,以确定 PH 结构域 F1相对于激酶结构域 F2的位置。发现两个结构域在酶的无配体状态下存在排列无序,ATP 竞争性抑制剂可减少这种无序,而变构抑制剂则会增加无序,这是一种罕见的结合诱导反有序转变情况。

对 SNAP25 的 DEER 研究揭示了 SN1 的一些寡聚化现象。添加 syntaxin 增加了调制深度,与预期的 2:2 复合物形成一致;添加 synaptobrevin 后,调制深度降低,表明一个 SN1 结构域被置换,形成了 2:1:1 的 syntaxin:SN1:synaptobrevin 复合物。2 型分泌系统的 XcpH 也观察到二聚化现象,研究其与 XcpJ、K 形成的四元复合物时,通过正交标记发现 XcpH 和 XcpJ 在复合物中存在排列无序。

研究人类细胞色素 P450 还原酶(P16435)的半醌形式时,通过点击反应引入硝基氧自旋标记,测量与黄素单核苷酸辅因子衍生的半醌自由基的距离分布,发现随着离子强度增加,668 位点的调制深度消失,表明 FAD 结构域(449 - 678)从 FMN 结构域(66 - 232)位移。β - 桶组装机器(BAM)的 BamA 组件(P0A940)可处于向内开放(IO)或侧向开放(LO)状态,添加 BamCDE 复合物可诱导其从 IO 状态转变为 LO 状态,且细胞外环 L6 在两种状态下都保持较大的节段性动力学。

对 Tau K19 与酸性膜结合的研究中,测量七个位点对的距离分布,并与分子动力学(MD)模拟结果比较,发现部分位点对模拟与实验结果偏差较大,表明当前无约束的 MD 方法难以准确预测像 Tau K19 这样的构象异质蛋白质的集合结构。

细胞内研究


对细菌中的一些蛋白质在细胞内的研究发现,AlphaFold 的蛋白质结构预测与蛋白质在生理相关条件下的行为相比,往往低估了其灵活性。例如,来自巴氏芽孢杆菌的 GTPase UreG(Q9RP19,F2031D2112)在大肠杆菌细胞中表达时,CW EPR 显示在 AlphaFold 预测为 IFR 的区域内,9、68 和 158 位点存在构象异构体的异质集合,其中一种主要构象类似无规卷曲,DEER 光谱表明细胞环境中 9 和 158 位点之间的距离分布变宽。

大肠杆菌的 PpiB 酶(P23869,F1641)在细胞环境中的动力学显著降低,且两个 Gd (III) 标记在 25 和 153 位点之间的距离分布比体外和人类 HeLa 细胞中更宽,表明 IFR 内的灵活性增加。细菌胞质伴侣 NarJ(P0AF26,F1951D2361)在大肠杆菌细胞中,IFR F1内的 21、104、119 和 149 位点以及 IDR D1内的 207 位点动力学减慢,21 - 104 位点对的 DEER 数据无法处理成距离分布,但原始数据表明 AlphaFold 预测为 IFR 的区域内平均距离大幅延长,这种构象转变可能与伴侣蛋白与其生物伙伴的结合有关。

对 BamA 的研究发现,它在大肠杆菌中存在开放和封闭两种构象,且抗生素 darobactin B 可诱导侧向门关闭。大多数细胞内 SDSL-EPR 研究表明,AlphaFold 的蛋白质结构预测存在局限性,这可能与其训练数据主要为蛋白质晶体结构有关。

集合建模


构象异质性需要用集合描述。距离分布约束(DDRs)可增强对构象空间的采样。例如,对 RNA 结合蛋白 hnRNP A1(P09651 - 2,D81F1901D3022)的研究发现,其富含甘氨酸的 IDR D2结构紧凑但具有异质性,且与折叠结构域 F1相互作用。在选择适合 DEER 实验的位点对时,基于信息论的最大相关、最小冗余算法优于基于弹性网络模型的方法。

链增长算法可生成大的原始集合,但不遵循详细平衡原则,可通过从预计算片段进行分层链增长来克服。另外,从约 50 种蛋白质的数据中学习 IDRs 的 CALVADOS 能量函数参数,用于预测人类蛋白质组 IDRs 的集合,但预测结果与实验结果存在差异。

将 IFRs 视为刚体可简化包含 IDRs 和 IFRs 的蛋白质的集合建模。例如,对人类多聚嘧啶序列结合蛋白 1(PTBP1)与脑心肌炎病毒内部核糖体进入位点(IRES)复合物的研究,利用 35 个 DDRs、一个小角 X 射线散射曲线和两个小角中子散射曲线,揭示了两种主要构象,对应 IRES RNA 铰链核苷酸的不同角度,且两个子集合中 RNA 识别基序存在适度的排列无序。

最初的 AF2 生成的构象集合非常狭窄,限制了其对结构异质性显著的蛋白质的适用性。后续方法旨在增加 AF2 集合的多样性,如对钠依赖性转运蛋白 MhsT(Q9KDT3,D91F4481D4532)的研究,通过主成分分析发现其结合位点交替访问相关的构象变化。AF3 生成的 100 个成员的集合分析表明,集合对齐不确定性与 PAE 密切相关。

目前,集合结构往往不符合提交到蛋白质数据库的严格质量标准,实验和建模方法在这一领域都尚未完全成熟。蛋白质集合数据库(PED)可用于存储相关数据,但目前不接受蛋白质与核酸的复合物,这种情况下研究人员可使用通用存储库如 Zenodo。

分子间相互作用


拥挤


细胞质是一个拥挤的环境,溶质占据约 40% 的体积,这使得分子间相互作用比在简单缓冲液中低浓度研究蛋白质时更频繁。体外可通过向缓冲液中添加合成大分子或丰富的细胞蛋白质来模拟细胞拥挤。

对 Nupr1(O60356,D921)的研究表明,拥挤会影响其 C 端和 N 端附近的动力学,尽管蛋白质整体仍保持无序状态。添加 200 mg/mL PEG8000 或 20% v/v 蔗糖在很大程度上重现了 UreG 蛋白在细胞环境中的动态变化。然而,NarJ 在细胞中 149 位点的固定化无法通过添加任何拥挤剂来重现。这些研究表明,体外拥挤实验有助于了解细胞环境对蛋白质结构、动力学和相互作用的影响,但简单的拥挤模拟可能无法完全捕捉活细胞的复杂性。

液 - 液相分离


液 - 液相分离(LLPS)是形成参与 RNA 加工和细胞应激反应的无膜细胞器的基础。LLPS 可由熵介导的疏水残基周围水网络的破坏驱动,导致较低的临界溶解温度。

使用自旋探针 4 - 羟基 - TEMPO 苯甲酸酯研究弹性蛋白样多肽(VAPVG)n和(TPVAVG)n的 LLPS 行为,其 CW EPR 光谱在温度变化时显示滞后现象,与冷却过程中侧链优先再水化一致。在两态 LLPS 系统中,CW EPR 光谱通常显示两个动态成分:一个是对应分散蛋白质的移动成分,另一个是对应凝聚相蛋白质的固定成分。

例如,人类 CPEB4(Q17RY0,D4671F7191D7262)的 D1构建体(1 - 448)在 441 位点的自旋标记显示出三个动态成分,表明 LLPS 从预形成的小聚集体发生,后续实验也观察到直径在 50 - 100 nm 之间的聚集体。FUS 蛋白 1 - 267 N 端 IDR 构建体在凝聚相的集合模型与良溶剂中的无规卷曲构象非常一致,与变性或分散的蛋白质相比仅略有压缩。hnRNP A1 蛋白的 CW EPR 光谱检测到不同短 RNA 构建体的 LLPS 行为存在差异。

结论和未来展望


SDSL-EPR 技术通过分析 CW EPR 光谱,可在液体溶液中提供关于构象无序的半定量信息,还可研究结合动力学。DEER 技术可量化排列无序,但需在 50 - 80 K 的固态下测量。由于构象异质蛋白质结构和动力学的复杂性,SDSL-EPR 通常与其他实验技术结合使用。

SDSL-EPR 可用于研究细胞内小和中等大小的可溶性蛋白质以及外膜蛋白质的构象,细胞内研究常揭示出比体外测量更多样化的构象集合。集合建模主要应用于 IDRs,对更大、更复杂的结构排列探索有限。目前,我们对人类蛋白质组中构象异质性和大规模动力学的理解仍处于早期阶段。

以往研究多集中于小构建体,未来需关注全长蛋白质。蛋白质的异质结构对环境因素和翻译后修饰高度敏感,系统地改变这些条件进行实验研究,对改进计算方法至关重要。Anfinsen 范式将蛋白质表示为单一构象,不适用于大多数人类和许多细菌蛋白质。为更好地理解蛋白质功能和蛋白质 - 蛋白质相互作用的基础,分子生物学需向集合范式转变,定量表征构象和排列无序。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号