编辑推荐:
基因组测序与蛋白质结构预测领域的最新发展为理解、预测和设计酶功能开辟了新的前沿。新酶的发现与功能注释对于阐明基因型与表型之间的关联以及开发工业应用生物催化剂至关重要。然而,准确预测酶催化功能仍面临重大挑战,新酶的发现往往依赖于偶然性。本研究呈现了一种基于金属配
基因组测序与蛋白质结构预测领域的最新发展为理解、预测和设计酶功能开辟了新的前沿。新酶的发现与功能注释对于阐明基因型与表型之间的关联以及开发工业应用生物催化剂至关重要。然而,准确预测酶催化功能仍面临重大挑战,新酶的发现往往依赖于偶然性。本研究呈现了一种基于金属配位引导的策略,该策略利用原子水平的机制原理挖掘蛋白质结构数据库以实现金属酶的靶向发现。研究人员将此框架应用于AlphaFold2蛋白质结构数据库(AlphaFold2 Protein Structure Database),以识别FeII/α-酮戊二酸(α-ketoglutarate, αKG)依赖性卤化酶家族的新成员,该家族能够选择性活化未活化的C(sp3)-H键,这是生产药物及其他高价值化合物中的关键转化步骤。这些自由基卤化酶属于大型且多样化的cupin超家族中的低丰度类别。由于序列保守性较低,在羟化酶、去饱和酶和差向异构酶等相关家族成员的复杂背景下,其识别尤为困难。该金属配位挖掘方法揭示了跨越多样化系统发育空间的多个此前未被识别的自由基卤化酶家族,且计算成本极低。研究预测通过两种新自由基卤化酶——AspX和BtnX的实验表征得到验证。值得注意的是,BtnX表现出在自由基卤化酶中前所未有的底物混杂性,为广泛的生物催化应用开辟了道路。
研究人员开发了一种基于金属配位引导的靶向金属酶发现策略,利用原子水平机制原理挖掘蛋白质结构数据库,并发表于《Nature》。该研究旨在解决酶功能预测准确性不足、新酶发现依赖偶然性的问题,尤其针对低丰度、低序列保守性的Fe
II/αKG依赖性自由基卤化酶在cupin超家族中难以识别的问题。研究得出以下核心结论:金属配位结构可作为功能分类的生物信息学标志物;该策略在AlphaFold2数据库中识别出70个此前未被探索的自由基卤化酶家族;实验验证了两类新酶AspX和BtnX,其中BtnX具有前所未有的底物混杂性。这一工作为系统发现稀有催化活性、开发新型生物催化剂提供了重要理论与技术基础。
关键技术方法方面,研究人员采用机制引导的结构生物信息学流程:首先构建Fe
II/αKG依赖性酶家族的结构数据库,从InterPro数据库检索含cupin结构域的蛋白质序列(约180万条),经预处理后获取AlphaFold2结构模型(530,814个);进而利用几何聚类规则在三维空间搜索2个组氨酸(2His)金属结合位点,以氢键约束和侧链N
τ–N
τ距离定义位点预组织状态;最后依据金属中心缺乏天冬氨酸/谷氨酸(Asp/Glu)配位残基的功能分类标准,识别具有开放配位位点的潜在自由基卤化酶。样本来源涵盖原核与真核生物,包括海洋病原菌Vibrio campbellii的AspX和海洋细菌Dinoroseobacter shibae的BtnX。
金属配位挖掘部分。 cupin超折叠结构在生命各域中广泛存在,具有极其广泛的生化功能。其进化历史复杂,以3His-1Glu基序及特征性双链β-螺旋(double-stranded β-helix, DSBH或jelly roll)桶状折叠为核心。Fe
II/αKG依赖性酶利用cupin超折叠参与多种代谢转化,其典型成员以2His-1Asp/Glu"面部三联体"基序结合Fe
II,而自由基卤化酶成员则转换为非典型的2His-1Gly/Ala基序以提供卤离子配位的开放位点。序列方法因N
2缩放限制难以在超大型家族中检测单氨基酸变化,而研究人员的三维结构基序搜索仅按N
1缩放,兼具灵敏度与可扩展性。研究人员从AlphaFold2数据库获取530,814个结构模型,发现456,585个含2His-Asp/Glu位点,仅946个缺乏近端配位残基而含Ala/Gly,提示自由基卤化酶活性。序列相似性网络(sequence-similarity network, SSN)分析验证了方法的有效性,捕获了所有已知自由基卤化酶,并为脱氯金胺卤化酶(dechloroacutamine halogenase, DAH)鉴定出40个推定成员,远优于传统BLAST方法。完整生物信息学图谱包含70个此前未被探索的簇,涵盖多个新的真核卤化酶家族。
新自由基卤化酶的发现部分。 研究人员选择簇X进行实验验证,该簇成员基因组背景多样,部分与酰基载体蛋白(acyl-carrier protein, ACP)相关基因共簇,提示ACP依赖性;部分则无此类邻近基因,提示自由站立底物。通过BLAST富集序列并构建更高粒度SSN(>50%序列同一性),揭示多个新亚家族。基因组邻域分析发现部分亚家族基因邻近氨基酸转运蛋白及氨基酸修饰酶编码基因。
AspX的发现与验证。 来自海洋病原菌Vibrio campbellii的AspX被选中进行生化验证。液相色谱-四极杆飞行时间质谱(LC-QTOF)分析显示AspX选择性氯化L-天冬氨酸,不作用其他氨基酸。核磁共振(NMR)鉴定产物为3S-氯-L-天冬氨酸,动力学参数为k
cat = 33.3 ± 0.5 min
-1,K
m = 0.64 ± 0.02 mM。AspX还可转移Br
-和N
3-。该发现将自由基卤化酶的底物范围从带正电(L-赖氨酸、L-鸟氨酸)和非极性(L-亮氨酸、L-异亮氨酸、L-正亮氨酸)氨基酸扩展至带负 daunting的L-天冬氨酸。
BtnX的发现与验证。 另一亚家族位于ACP依赖性与自由站立卤化酶的交汇点。序列同源性搜索揭示BtnX位于海洋细菌Dinoroseobacter shibae的"杀手质粒"上,该细菌与甲藻Prorocentrum minimum存在共生关系。基因敲除实验表明BtnX编码基因Dshi_3684与细菌致病性正相关,且与能量耦合因子(energy-coupling factor, ECF)生物素转运蛋白复合物编码基因共定位。LC-QTOF和NMR证实BtnX将生物素转化为2R-氯生物素,动力学参数为k
cat = 0.96 ± 0.02 min
-1,K
m < 2 μM。X射线晶体学(PDB ID: 9Q04)确认了氯化的立体选择性。BtnX同样可转移Br
-和N
3-。
多功能自由基卤化酶部分。 与AspX及其他已知自由基卤化酶的狭窄底物范围不同,BtnX表现出高度混杂性。结构-活性研究表明丙酸头基是底物识别与卤化的关键要求,而"尾部"的化学结构变化高度耐受。BtnX可催化从游离脂肪酸到各种含羧酸和氨基酸的生物及合成分子的氯化,包括胆汁酸、荧光染料、氨基酸、类肽和肽等。该转化的价值体现在早期阶段简单分子的功能化以产生α-卤代酸前体,以及药物分子的后期衍生化,如非酒精性脂肪性肝炎和纤维化药物候选物RLA8的酶促卤化。
分子基础解析方面,研究人员解析了BtnX厌氧条件下与生物素结合的早期催化中间态晶体结构(PDB ID: 9PV1,分辨率1.20 ?)。不对称单元包含BtnX二聚体,其中A链活性位点含αKG和生物素,B链含Fe
II、αKG、Cl
-和生物素。结构揭示两个关键特征:生物素羧酸根基团与活性位点残基(Ser120、Asn119和Arg248)形成特异性氢键网络,将pro-2R H原子定位于金属位点附近;生物素其余部分位于延伸的溶剂暴露蛋白通道中,主要形成非特异性疏水相互作用。定向突变扰动Ser120周围氢键网络导致酶活性和化学选择性降低。这种"特定氢键定位-溶剂暴露通道"的组合构成了BtnX底物混杂性的分子基础。
系统发育分析显示BtnX亚簇位于ACP依赖性卤化酶(CurA)与自由站立小分子卤化酶(AspX)之间的独特分支点。与其他具有埋藏活性位点口袋的自由基卤化酶不同,BtnX的溶剂暴露通道使其成为实验室进化工程应用的异常可进化模板。G117D或G117E点突变可将BtnX转化为羟化酶,用于生产α-羟基酸。
研究结论与讨论部分。 研究人员认为,尽管酶以其高选择性著称,但其进化由底物选择性和反应结果的广泛混杂性驱动。这种功能分歧通常由催化中心附近的少数特定残基控制,无法通过基于总序列相似性的聚类方法捕获。AlphaFold2等准确蛋白质结构预测算法产生的大型数据库,使得利用特定三维信息搜索和注释酶功能成为可能。
该研究展示了如何将酶功能的基本机制洞见提炼为描述功能保守物理特征的原子水平精确约束,用于挖掘AlphaFold2蛋白质结构数据库。尽管AF2数据库缺少金属和其他辅因子,该方法利用酶活性位点对金属结合的固有缘前组织性,以完全apo形式挖掘金属蛋白的预测结构。更广泛的金属配位挖掘为揭示通过复杂系统发育轨迹在大型多样化酶超家族中进化的新颖或稀有酶功能提供了强大途径-reset途径。过去20年通过天然产物研究发现了6个Fe
II/αKG依赖性自由基卤化酶家族,而活性位点映射方法迅速识别了70个此前未被识别的推定卤化酶家族。未活化C(sp
3)-H位点的酶促卤化在生物学中相对罕见,除Fe
II/αKG依赖性卤化酶外,仅已知双核铁和双核铜卤化酶两类可催化此类转化。
研究人员通过扩展目标发现方法考察cupin超折叠中2His-X
n金属位点的多样性分布,揭示了已知和新型推定生物金属位点的广泛配位环境。该方法因算法效率而具有可扩展性,无需成对比较,非常适合管理当前序列和结构信息的爆炸式增长。除酶之外,该方法可扩展至任何具有功能重要原子相互作用的蛋白质,如参与识别或信号转导的蛋白质,推动大规模理解序列-结构-功能关系。