通过协同的计算和生物物理方法筛选能够结合Gadd45β的短肽

《Protein Science》:Selection of short Gadd45β-binding peptides through a synergistic computational and biophysical approach

【字体: 时间:2025年11月24日 来源:Protein Science 5.2

编辑推荐:

  本研究通过计算模型和生物物理实验结合的方法,设计并筛选出靶向Gadd45β蛋白P1口袋的D-三肽。利用FLAPsite算法预测Gadd45β的四个结合口袋,并通过SPR和NMR实验验证,发现RYR和VRW肽与P1口袋具有高亲和力(KD分别为2.75×10^-5 M和2.19×10^-5 M)。分子动力学模拟显示,RYR和VRW通过氢键、疏水相互作用等与蛋白形成稳定复合物,且RYR在高温下仍保持高结合稳定性。跨膜连接实验证实RYR与αL2loop的特定结合。细胞实验表明RYR可抑制高表达Gadd45β的急性髓性白血病细胞增殖。该策略为快速发现靶向蛋白腔道的短肽提供了有效方法。

  本研究探讨了针对Gadd45β蛋白特定腔室设计线性D-三肽的可能性。Gadd45β被选为模型蛋白靶点,因其在多种疾病通路中的重要性,包括癌症和炎症。为了识别能够特异性与预测结合位点相互作用的肽,我们结合了计算建模和生物物理实验。计算分析首先用于表征Gadd45β的结构特征和潜在结合位点,随后基于这些信息设计并优化了线性D-三肽,以实现与目标蛋白表面的特异性结合。这些候选肽随后通过一系列生物物理实验评估其结合亲和力、特异性和潜在治疗活性。通过互补的计算模拟,我们获得了肽-蛋白识别动态的原子级见解。这种集成的计算-实验策略成功鉴定了两种D-三肽,RYR和VWR,它们能够结合Gadd45β的生物相关位点,展示了早期阶段肽配体发现的一般框架。

在研究的引入部分,我们强调了肽在药物发现中的潜力,它们提供了介于小分子和生物制剂之间的独特化学空间。随着平行和组合肽合成技术、结构修饰以及基于人工智能的预测方法的发展,肽药物发现的速度和效率得到了显著提升。然而,传统的组合化学方法在配体识别过程中仍然面临诸多挑战,如大量单分子合成的成本和混合筛选中可能产生的副产物。尽管人工智能和机器学习方法提供了强大的计算能力和更先进的算法,可以预测分子相互作用并筛选潜在的配体,但该过程仍需要进行湿法筛选实验。此外,大规模的湿法随机筛选仍然需要大量的经济资源,不仅用于化合物库的获取和维护,还用于体外筛选。因此,基于合成或噬菌体表面表达肽的组合筛选方法,虽然在早期阶段所需的实验工作量和资源较少,但往往导致分子结构较大,难以通过脱肽化转化为更类似于小分子的生物活性化合物。基于此,研究提出了一种平衡的策略,即在计算筛选基础上,结合人工智能的靶向应用和简单高效的平行合成方法,如固相合成短肽,这在任何实验室中都能实现。

短肽相比其较大类似物具有诸多优势,包括低成本合成、广泛的化学多样性、易于修饰、高生物活性、良好的合成可及性以及可调的功能化特性。由于它们的代谢产物通常是氨基酸,且在体内不易积累,因此具有高度的生物相容性、安全性和低毒性,同时也表现出较低的免疫原性。此外,短肽的序列优化可以在成本效益和时间效率上快速完成。基于这些优势,我们开发了一种简化的方法,将计算筛选、化学合成和基于稳健技术(如表面等离子体共振和核磁共振)的生物物理分析相结合,用于小D-三肽靶向蛋白腔室的药物开发。

Gadd45β作为靶点,其结构特征和生物学功能具有重要意义。Gadd45蛋白家族包括Gadd45α、Gadd45β(最初称为Myd118)和Gadd45γ(CR6)的剪接异构体,这些蛋白在细胞核中主要分布,具有约18千道尔顿的分子量,且富含酸性残基(约16–17%的总残基),这使得它们在生理pH条件下表现出显著的负电荷。Gadd45蛋白在压力信号传导中起关键作用,影响细胞凋亡、细胞周期停滞、DNA修复、细胞存活和衰老等过程。Gadd45蛋白之间共享55%–57%的氨基酸序列相似性,且缺乏酶活性。Gadd45β在细胞核和细胞质中通过蛋白质-蛋白质相互作用调控广泛的生物学过程,这表明其在细胞生理和病理中具有多样的作用。尽管Gadd45β的实验性三维结构尚未确定,但一些预测方法表明其可能包含一个四链β折叠核心、五个α螺旋和两个酸性环(aL1,残基62–68;aL2,残基103–117)。这些环对于其功能至关重要,特别是在抑制cdc223和MKK7方面。此外,aL2和螺旋3(H3)以及螺旋4(H4)的部分残基也参与了与MKK7的相互作用。由于Gadd45β在多种疾病组织中过度表达,因此被认为是潜在的治疗靶点。DTP3,一种结合MKK7并抑制Gadd45β/MKK7复合物的D-三肽,展示了Gadd45β的治疗潜力,同时也验证了小分子类似物可以通过其骨架的构象灵活性来实现最佳的相互作用能力。DTP3目前正在进行临床试验,作为治疗多发性骨髓瘤(MM)的药物。

由于Gadd45β的生物学功能主要依赖于其蛋白质相互作用,因此通过小配体调节这些相互作用成为当前研究的重点,尤其是为了获得小分子药物的前体和用于生物测定的特异性探针。在这一背景下,我们采用了一种结合计算筛选、人工智能的应用以及简单快速的固相合成方法,以探索Gadd45β的结合位点。我们通过计算建模确定了Gadd45β的结构特征,并通过计算筛选方法设计了D-三肽。随后,我们通过生物物理实验验证了这些D-三肽的结合亲和力和特异性。

为了识别Gadd45β的结合口袋,我们使用了FLAPsite算法,该算法集成了FLAP软件,用于探索所有可能的结合位点。这一过程生成了可访问的口袋作为PDB文件。我们检测到了四个不同的结合腔室,P1至P4。P1腔室(在图1a中用绿色表示)被预测位于两个酸性环aL1和aL2之间,而P3腔室则靠近aL1(用橙色表示)。这些区域作为某些治疗相关互作分子(如MKK7)的结合靶点,能够容纳防止其与Gadd45β结合的小分子。

为了验证所识别的结合口袋,特别是P1腔室是否在Gadd45β中具有独特的结构或静电特性,我们进行了详细的序列和结构分析,比较了Gadd45蛋白家族的三个成员(Gadd45α、Gadd45β和Gadd45γ)。Gadd45β具有两个酸性环,其中aL1(残基62–68)包含连续的负电荷侧链(DEEEEDD),而aL2(残基103–117)则提供了更为分散的酸性残基(三个谷氨酸和一个天冬氨酸)。这种初级序列结构创造了Gadd45β独有的双部分酸性表面,使得两个酸性环之间的有限体积中形成集中静电场。

通过多重序列比对(MSA)和三维结构比较(图S3b–d),我们发现这种连续的高密度酸性模体是Gadd45β蛋白的显著特征。相比之下,Gadd45α的类似区域含有酸性残基,但这些残基被替代所打断,导致局部电荷连续性降低或引入碱性电荷(如R67)。Gadd45γ则通常表现出删除或非保守替代,破坏了连续酸性序列。因此,尽管所有家族成员在中心区域共享总体的酸性斑块,但只有Gadd45β具有紧密排列、未中断的酸性模体,从而相对于α和γ增强和定位负电位。

为了获取结合这些腔室的配体,我们选择D-三肽作为起始点,因为它们的大小(均小于500 Da)和D-构型的残基使其成为开发小分子前体的理想选择。针对P1至P4腔室的D-三肽通过优化的FLAPdock版本生成。FLAP软件用于生成每个氨基酸的起始构象,随后通过采样扭角空间扩展三肽结构,并在腔室中最小化和评分这些构象。FLAPdock用于对接三肽,通过结合疏水、静电、氢键供体和受体分子相互作用场(MIFs)的相似性以及经典能量项进行评分(更多技术细节见第4节)。该软件生成了四个D-三肽集,按其与目标腔室的理化性质互补性进行排名。我们筛选了19^3=6859种三肽,即所有19种天然氨基酸(不包括半胱氨酸)的组合。对于每个腔室,我们选择了25个最佳命中,共100个D-三肽序列,尽管仅从每个腔室中选择了前8个排名最高的三肽进行合成和随后的实验测试(共32个三肽)。这些三肽设计在四个Gadd45β腔室上分别命名为G1、G2、G3和G4,每个集合的三肽序列和目标腔室见图1b。

在测试设计的三肽与Gadd45β的结合时,我们首先通过表面等离子体共振(SPR)使用Biacore 3000仪器(Cytiva,米兰,意大利)进行了初步筛选,测试了它们在CM5传感器芯片上固定rhGadd45β时的结合能力。在单个浓度100 μM下,数据表明G1.3和G1.6这两种三肽(分别具有序列D-Arg-D-Tyr-D-Arg-NH2和D-Val-D-Arg-D-Trp-NH2,后简称为RYR和VRW)表现出最强的结合能力(图1c)。G2和G4集合基本无活性,而G3集合中的一些三肽显示出较弱的结合信号。鉴于P1腔室对蛋白生物学活性的显著相关性,后续的生物物理研究中省略了针对其他腔室的三肽。

在初步筛选后,我们进一步测试了RYR和VRW三肽在剂量依赖实验中的结合亲和力和结合动力学。如图2b和2c所示(另见表1和表2),两种三肽均表现出剂量依赖性结合,显示出相似的动力学特性,包括快速结合(k_on=10^2 M^?1/s)和解离速率(K_off=10^?3 s^?1)。通过使用BiaEvaluation软件进行数据拟合,我们确定了RYR的解离常数(K_D)为2.75 ± 0.07 × 10^?5 M,而VRW的K_D为2.19 ± 0.13 × 10^?5 M。在本次实验中,同样测试的三肽FKK和RQH均未显示出与蛋白的结合。

为了进一步补充SPR无标签筛选并获取三肽结构对Gadd45β结合的贡献信息,我们对G1集合中的六种三肽(G1.1至G1.6;图1b)进行了饱和转移差核磁共振(STD-NMR)分析。STD实验不仅能确认结合现象,还能映射配体与蛋白腔室的表面相互作用。该实验涉及在含有蛋白(微摩尔范围)和配体(大量过量)的样品中进行两种不同的1D-NMR光谱分析(Klein et al. 1999;Mayer and Meyer 1999;Mayer and Meyer 2001)。在第一种NMR实验(称为“在共振”)中,蛋白被选择性照射在接近蛋白信号但远离配体信号的无线电频率下。长时间照射导致整个蛋白和结合配体的质子共振饱和,这种在共振光谱中仅包含那些因饱和而强度减弱的配体信号。第二种NMR实验则设计为在无共振条件下生成完整的蛋白和配体光谱。STD光谱是通过从两种实验中相减获得的,仅显示与蛋白结合的质子信号。此外,越靠近蛋白腔室的质子,其在STD光谱中的信号越强。

对于每个三肽-Gadd45β系统,我们通过向含固定蛋白(20 μM)的NMR管中加入增加的三肽量,以达到肽/蛋白摩尔比(R)从10到100或200。通过比较六个三肽-蛋白系统的STD系列,我们突出了最佳的结合分子。在图3a和3b以及图S13中展示了六种三肽的STD系列,随着R比值的增加。如图3a和3b所示,RYR(G1.3)和VRW(G1.6)被确认为Gadd45β的有效互作分子。然而,一些在SPR中表现出较差互作的三肽,如GKF(G1.1)和RYK(G1.4),在这些高浓度下也显示出与蛋白的互作(图S13a–d)。鉴于SPR分析中显示的较弱互作信号,它们未被进一步研究。值得注意的是,FKK(G1.2)和RQH(G1.5)在两种技术中均未显示出结合能力。这些结果表明,结合并不是仅由精氨酸和赖氨酸的正电荷侧链与蛋白的扩展负电荷区域之间的静电相互作用所介导,而是由芳香和极性热点的组合相互作用所主导。

为了进一步了解D-三肽与Gadd45β的结合机制,我们进行了计算模拟,分析了两种最佳结合分子RYR和VRW。该过程涉及结合态模拟和对不同温度下的多个独立无偏分子动力学(MD)模拟,以识别每种三肽的可能最终结合模式(见图S6a–e)。通过这种分析,我们发现两种三肽都结合了Gadd45β的P1腔室。该腔室由两个平行的酸性环构成,这些环缺乏稳定的二级结构元素,表现出显著的灵活性(图S1c–e)。此外,由于三肽中存在精氨酸残基,这些残基具有三个CH2侧链,因此三肽本身也表现出高度的灵活性。

在进行结合态模拟时,我们采用了一种称为“放松复合物方案”(RCS)的方法,其中通过MD模拟生成无结合状态的Gadd45β构象,然后通过蛋白环的RMSD聚类分析选择代表性的构象(图S1d)。在进行MD模拟时,我们考虑了不同温度下的多个独立无偏模拟,以识别每种三肽的可能结合模式。对于每个三肽,我们进行了三次独立的MD模拟,以获取310 K下的动态采样。通过这种策略,我们获得了对结合模式的更全面理解,并且通过计算分析确认了三肽与Gadd45β之间的相互作用。

为了验证这些三肽的结合能力,我们还进行了高温度MD模拟,以评估不同结合模式的热稳定性。这种方法在计算资源需求上比传统的REMD模拟更为简单可靠(见图S6e)。我们通过在310 K下对每个三肽(RYR和VRW)进行聚类,然后利用代表性的结合态结构进行多个独立的高温度MD模拟。这种方法可以加速构象采样,并揭示在常温下可能无法观察到的早期结构不稳定迹象(Ding et al. 2025;Pavan et al. 2022)。在高温度MD模拟中,我们发现RYR的结合模式在330 K下表现出较高的稳定性,其中RYR的结合态占分析帧的85%(图6a,b)。而VRW的结合模式在330 K下则显示出较低的结合比例,其中VRW的结合态仅占分析帧的17%。当温度升至370 K时,VRW的结合比例进一步降低,仅占分析帧的6%。相比之下,RYR的结合态在370 K下仍保持较高的稳定性,占分析帧的18%,其中在一次模拟中保持结合长达约200 ns。

通过这些分析,我们发现RYR和VRW的结合模式中,pose #2和pose #3分别表现出最高的稳定性,这与在生理温度下的MD模拟结果一致。此外,我们还采用了基于计算的突变策略,以补充我们的设计流程并提供关于肽-蛋白识别的机制性见解。我们生成了三个突变系统,分别对应aL1、aL2和aL1–aL2(图S11),并使用全原子MD模拟进行分析。每个突变系统进行了三次独立的模拟,总模拟时间接近1 μs,所有模拟参数与野生型系统的参数相同。在模拟过程中,我们监测了三肽与蛋白之间的结合,通过测量三肽与蛋白残基之间质心距离(COM距离)来确定结合状态。COM距离大于6 ?的帧被分类为未结合状态。

基于这些分析,我们发现所有三个突变系统在使用RYR作为起始结构时均表现出快速的三肽解离,导致结合态的比例极低(图S11)。这些结果与我们的结构模型一致,表明引入的突变破坏了维持稳定结合的关键界面相互作用。尽管计算分析无法完全替代实验验证,但模拟的可重复性和内部一致性提供了对所提出的结合机制的有力支持。

为了进一步验证这一方法,我们还进行了交联实验,以确认RYR三肽在Gadd45β上的结合位点。我们使用了N-末端标记的偶氮环化学基团,该基团能够与任何电子供体功能在接近反应中心的区域形成稳定的共价键(Rega et al. 2018)。通过这种方法,我们分析了交联后的蛋白片段,并使用LC–MSMS技术识别可能与三肽交联的片段。在未暴露于三肽的蛋白样品中未观察到额外的峰(未显示),但在暴露于标记三肽的样品中,我们发现片段98–115(序列LAQLLGEPAETQGTTEAR,分子量1883.9591 amu)主要对应于aL2区域,并被标记三肽修饰(见图7a–c)。该修饰三肽的分子量为2458.2821 amu,对应于m/z M+3H+ = 820.4377(计算m/z 820.4351),其在样品中的相对比例约为0.1%。而在未处理的蛋白样品中,该标记三肽完全缺失。此外,我们未发现其他可能的修饰,如氧化的甲硫氨酸或半胱氨酸,从而确保了分析的准确性。

尽管实验条件下的转化率较低,表明三肽与蛋白之间的识别较弱,但这些结果无疑表明了结合发生在aL2区域,这与计算筛选和广泛的模拟数据一致。这些数据不仅验证了我们对结合位点的预测,也进一步支持了三肽与蛋白之间的特异性相互作用。

为了评估三肽在细胞内的活性,我们选择了一组表达不同水平Gadd45β的癌细胞,包括CESS、DU145和LNCaP。我们首先通过流式细胞术和免疫荧光实验评估了两种三肽RYR和VRW在急性髓系白血病CESS细胞膜中的渗透能力。在高浓度(500 μM)下,我们观察到两种三肽的剂量依赖性摄取(图8a–d)。随后,我们对这些细胞系进行了处理,以测试三肽在诱导细胞死亡方面的效果。在使用RYR和VRW处理后,我们发现RYR显著降低了CESS和DU145细胞的存活率,而VRW则对所有分析的细胞系均无影响(图8e)。这一结果表明,尽管VRW在体外表现出较低的结合能力,但RYR在细胞内具有较高的活性,并且可能成为生成更有效化合物的有力候选分子。

通过这种结合计算和实验的方法,我们从一个相对较大的分子集合中筛选出了两个D-三肽,它们能够特异性结合Gadd45β的特定生物学相关腔室,突显了在早期药物发现阶段整合多种方法的重要性。计算分析为初始筛选提供了大量D-三肽组合的化学空间,同时减少了合成和实验分析的工作量。这些方法的结合将在未来指导更多针对Gadd45β及其他相关治疗靶点的小配体设计,以进一步优化其药效和药代动力学特性。

本研究的结论表明,我们采用了一种整合方法,结合了计算筛选软件(Cross et al. 2010)、固相合成短肽、无标签筛选、STD-NMR、先进的计算模拟(如结合态对接或分子动力学)以及基于细胞的实验。这种综合方法使我们能够快速定义对于治疗性蛋白活性位点的分子识别结构特征。我们选择Gadd45β作为目标蛋白的示例,因其具有独特的结构特征和已研究的区域和活性位点(Capece et al. 2018;Papa et al. 2004a;Papa et al. 2004b;Papa et al. 2008;Rajpoot et al. 2020;Sandomenico et al. 2020;Tornatore et al. 2014b;Verzella et al. 2018;Zazzeroni et al. 2003)。我们选择使用D-构型的三肽化学空间作为结合结构的来源,以获得抗蛋白酶的分子,具有较少的功能基团,从而更容易转化为小分子。

通过无标签结合实验筛选出的三肽,我们进行了广泛的STD-NMR分析,以定义相互作用的功能基团,并进行了广泛的计算结构分析,以确定两种选定三肽在蛋白腔室中的结合模式。这些结果不仅验证了三肽与蛋白之间的结合,还提供了对相互作用机制的深入理解。尽管三肽的结合亲和力相对较低(微摩尔范围),但数据表明我们能够通过有限的合成和湿法筛选工作,快速获得针对预定义结合位点的特异性结合分子。结构数据表明,蛋白质与这两种三肽之间的识别涉及芳香和脂肪族基团,以及极性和离子性位点的广泛相互作用网络。

这种方法可以优化使用其他计算筛选平台(如Vincenzi et al. 2024)或更高效的平行湿法筛选方法(如Bruce et al. 2024;De Keyser et al. 2025),以识别特定蛋白腔室的分子前体。这种方法要求有限的合成、筛选和结构研究工作,并且能够获得广泛的应用,特别是对于最有趣且最难研究的分子类别——蛋白质-蛋白质相互作用(PPIs)。该方法可以扩展到其他治疗性靶点,被视为一种工具,以快速获得可修改和优化的候选分子,从而匹配小分子特有的药效和药代动力学特性(见图9)。

本研究的方法包括蛋白质结构的准备、三肽设计、无标签结合实验、STD-NMR分析、分子动力学模拟和细胞实验。通过这种方法,我们能够识别并验证针对特定蛋白腔室的短肽配体。这种方法不仅适用于Gadd45β,还适用于其他相关治疗靶点,为未来药物设计提供了重要的参考。此外,这种方法在实验和计算的结合下,为早期药物发现阶段提供了一种有效的策略,有助于快速筛选和优化具有潜在治疗价值的分子。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号