Nature:RFdiffusion2人工智能平台实现高效从头酶设计新突破

《Nature》:Computational design of metallohydrolases

【字体: 时间:2025年12月05日 来源:Nature 48.5

编辑推荐:

  本研究针对环境污染物降解缺乏高效催化酶的难题,开发了RFdiffusion2人工智能平台,通过量子化学计算获得的活性位点几何构型直接设计锌金属水解酶。实验验证显示最优设计ZETA_1的催化效率(kcat/KM)达16,000 M-1s-1,较既往设计提升三个数量级,晶体结构证实设计模型与实验结构高度吻合。该技术实现了无需实验优化的零样本高效酶设计,为定制化生物催化剂开发开辟了新途径。

  
随着人类活动产生的环境污染问题日益严重,开发高效降解污染物的生物催化剂成为当务之急。自然界中,金属水解酶能够催化一些最具挑战性的水解反应,它们利用结合的金属离子激活水分子,使其能够切割底物分子中的化学键。然而,对于许多新型污染物,自然界尚未演化出相应的高效水解酶。传统蛋白质工程方法虽然能够扩展金属水解酶的底物范围,但通常需要初始的底物混杂活性,且往往需要经过大量的定向进化才能达到天然酶的活性和效率水平。
在《自然》杂志最新发表的研究中,由David Baker教授领导的研究团队报道了一种革命性的人工智能驱动酶设计方法。该研究团队开发了RFdiffusion2这一新一代生成式人工智能流程匹配模型,能够直接从量子化学计算获得的活性位点构型出发,设计出具有高效催化活性的锌金属水解酶。这一突破标志着计算酶设计领域迈入了新纪元,为定制化生物催化剂的开发提供了强大工具。
研究团队采用了几项关键技术方法:首先基于密度泛函理论(DFT)计算构建反应过渡态理论酶模型(theozyme);利用RFdiffusion2进行原子级亚结构支架生成,实现了序列位置和侧链旋转异构体不可知的酶设计;通过ProteinMPNN进行序列设计,并利用AlphaFold2进行结构预测验证;采用PLACER深度神经网络评估活性位点预组织程度;最后通过X射线晶体学解析蛋白质三维结构。

RFdiffusion2的技术创新与优势
传统的RFdiffusion方法需要预先指定催化残基的序列位置和骨架坐标,这严重限制了采样空间。即使对侧链χ角χ1、χ2和骨架扭转角进行相对粗糙的采样,完整催化位点的侧链构象和序列排列也有约1018种可能选择。RFdiffusion2通过两大关键创新解决了这一瓶颈:一是原子级亚结构支架能力,只需指定与反应过渡态相互作用的关键官能团位置,而非完整的侧链和骨架构象;二是序列位置不可知支架能力,无需预先指定基序残基的序列位置。
RFdiffusion2用流匹配(flow matching)替代扩散过程,在训练过程中提供随机选择的天然原子坐标(不含序列位置信息),从而实现了序列位置不可知的原子亚结构支架。如图1所示,RFdiffusion2能够围绕固定的催化官能团位置和底物坐标直接生成多样化的蛋白质结构,让模型自行解析未知的自由度(催化残基的序列位置和侧链旋转异构体构象)。
第一轮设计验证与ZETA_1的特征
研究团队以荧光酯底物4-甲基伞形酮苯乙酸酯(4MU-PA)的水解为目标反应,通过DFT计算确定了Zn(II)-OH亲核攻击决定步骤的过渡态几何结构。从5,120个RFdiffusion2推理轨迹中,研究人员筛选出96个设计进行实验验证。
实验结果令人振奋:五个设计(A1、A8、B9、C4和F7)显示出显著高于背景的活性。其中最优设计A1(命名为ZETA_1)的催化效率(kcat/KM)达到16,000±2,000 M-1s-1,比先前设计的金属水解酶(3-60 M-1s-1)高出三个数量级。ZETA_1还表现出良好的稳定性,能够完成至少1,000次催化循环。

结构分析表明,ZETA_1与已知蛋白质结构差异显著,在蛋白质数据库(PDB)和AlphaFold结构数据库(AFDB)中最相似结构的TM分数分别为0.41和0.49,且没有类似的催化残基排列。AlphaFold2预测其无底物结构与设计模型高度一致,PLACER评估显示ZETA_1的活性位点高度预组织,催化侧链固定在适当位置,底物紧密保持在设计位置。
活性位点机制与突变验证
ZETA_1的活性位点由一个主要疏水的口袋组成,三个组氨酸通过Nε原子配位Zn(II)离子,一个天冬氨酸作为潜在的广义碱,一个天冬酰胺与香豆素环形成氢键。与生成ZETA_1使用的原始理论酶模型一致,Zn(II)离子还充当氧阴离子空穴,稳定过渡态中发展的负电荷。
锌滴定实验测得Zn(II)的解离常数(KD)为41±5 nM,与先前设计的金属蛋白相似。突变实验验证了各个催化残基的功能:同时突变三个金属配位组氨酸残基为丙氨酸(H118A/H130A/H134A)以及其中两个单点突变(H118A/H134A)完全消除了酶活性。将第三个Zn(II)配位残基突变为丙氨酸(H130A)导致kcat/KM仅下降13倍,而 proposed 广义碱D67突变为丙氨酸对kcat/KM影响很小,但增加了Zn(II)结合亲和力。这些结果表明H130和D67可能存在竞争性Zn(II)结合位点。

第二轮设计优化与效率提升
基于第一轮研究的启示,团队从包含催化碱基的新DFT理论酶出发,使用在更大数据集上训练的RFdiffusion2新版本生成蛋白质结构。通过Chai-1对蛋白质-Zn(II)-底物磷酸酯复合物的预测评估,筛选出活性位点高度预组织的设计。
第二轮设计的成功率显著提高:96个设计中,85个成功表达且可溶,11个涵盖3种不同折叠的设计具有显著的锌依赖性4MU-PA水解活性。其中5个设计的kcat/KM大于104M-1s-1,6个大于103M-1s-1。最优设计ZETA_2的kcat/KM达到53,000±5,000 M-1s-1,kcat为1.5±0.1 s-1;ZETA_3的kcat/KM为19,000±2,000 M-1s-1;ZETA_4的kcat/KM为1,100±200 M-1s-1

晶体结构验证设计准确性
研究团队解析了最活跃设计ZETA_2的晶体结构(PDB:9PYJ),3.5?分辨率的实验结构与设计模型高度一致,骨架Cα原子均方根偏差(r.m.s.d.)为1.1?,催化残基以设计的几何构型预组织。结合口袋与设计模型中的过渡态高度互补。在Zn(II)浸泡后解析的2.1?结构(PDB:9PYL)也显示骨架与设计模型近乎叠加(Cα r.m.s.d.=0.8?),Zn(II)离子100%占据设计位置。

研究意义与未来展望
本研究证明了RFdiffusion2能够直接从量子化学计算获得的活性位点构型生成高活性金属水解酶。零样本设计出催化效率超过104M-1s-1的酶(ZETA_1),且无需实验优化即达到这一活性水平,是从头酶设计领域的重大突破。第二轮设计中又成功获得三个高效酶(ZETA_2、ZETA_3和ZETA_4),进一步证明了该设计策略的稳健性。
ZETA_1-4的结构彼此差异显著,且与已知结构不同,其催化效率已达到天然金属水解酶对类似底物的典型范围(104-106M-1s-1),且优于所有先前设计的未经优化的金属水解酶。实验表征强有力地证明它们按照设计机制发挥作用:利用结合的Zn(II)离子激活水分子进行亲核攻击,并稳定产生的氧阴离子中间体和过渡态。
PLACER和Chai-1集合预测表明,获得超过104M-1s-1的kcat/KM的关键在于底物相对于激活水和Zn(II)离子的精确定位。未来的金属水解酶设计若能:(1)定位广义碱使其不能重新配置与结合金属离子相互作用;(2)更好地预组织金属结合残基;(3)引入额外的侧链氧阴离子稳定,有望将活性提升至与最活跃天然金属水解酶相当的水平。
RFdiffusion2-PLACER设计方法相比先前从头酶设计方法具有多重优势,应能广泛应用于多种化学反应的高效催化剂开发。通过直接支架侧链官能团,而非RFdiffusion1.27所需的骨架N-Cα-C=O坐标,RFdiffusion2避免了显式枚举催化侧链旋转异构体构象和沿线性序列放置催化残基的需要,使每个设计轨迹能够从巨大可能性空间中采样。结合PLACER和Chai-1评估活性位点预组织和底物-过渡态定位,被证明能有效识别最活跃的设计,这一方法与在从头设计的丝氨酸水解酶和逆醛缩酶中的类似观察结果表明,PLACER及相关深度学习方将在设计排名中发挥广泛作用。
这项研究不仅为环境污染物降解提供了潜在的高效生物催化剂,更开创了人工智能驱动酶设计的新范式,标志着计算生物学在解决实际化学挑战方面迈出了重要一步。随着这些工具的广泛应用,预计将加速定制化生物催化剂的发展,为可持续化学和生物技术开辟新的可能性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号