编辑推荐:
本综述聚焦 AI 驱动的从头酶设计(de novo enzyme design)领域,探讨基于机器学习(ML)的结构 / 序列设计策略、计算机模拟(in silico)功能验证及酶优化方法,分析当前效率低、功能实现难等挑战,展望其在突破天然酶限制、推动工业与医学应用中的潜力。
摘要
酶在生物过程及工业领域应用广泛。自上而下的改造策略(如定向进化)在优化天然酶中成果显著,而自下而上的从头酶设计则能摆脱天然模板,创造具有定制催化功能的新型酶。人工智能与计算能力的进步极大推动了该领域发展,实现酶结构与氨基酸序列的快速生成及优化,提升设计效率与酶的催化性能、稳定性。本文综述 AI 驱动从头酶设计的最新进展,讨论验证与优化策略,并分析技术整合的挑战与前景。
引言
酶设计通过改造酶功能解决科学、工业与医学难题,可突破天然酶在稳定性、特异性等方面的局限。传统酶工程依赖定向进化等自上而下策略,虽优化了 P450 等酶的效率,但受限于局部序列空间探索。从头酶设计则从第一性原理或学习模型出发,生成全新蛋白序列与结构,可访问天然界不存在的折叠与功能,通过生成模型与物理模拟全局搜索序列 - 结构空间,绕过局部最优解。早期设计基于物理化学原理,如利用三级 / 四级结构几何参数或片段法,但需大量结构知识且参数化困难。机器学习的兴起革新了该领域,其驱动策略可针对已知功能位点或设计需求进行计算机设计与功能验证,并在优化中发挥关键作用。
数据管理
高质量数据集是 AI/ML 驱动酶设计的基础。目前已建立专门数据库,涵盖氨基酸序列、蛋白质结构、酶功能、生化反应及代谢通路等信息,为模型训练提供支撑。
从头酶设计策略
从头酶设计主要通过两种途径创造新型酶:
- 基于结构的策略:利用物理能量函数与空间模式算法,从三维约束中推导稳定构象。
- 基于序列的策略:借助深度生成模型,从蛋白质数据集中学习共进化模式,基于数据驱动原则生成功能序列。与依赖模板的方法不同,其可探索全新序列 - 结构组合。
设计筛选与突变评估
对从头设计的酶进行改造与优化至关重要。常用成熟酶工程策略提升其稳定性与效率,例如通过易错 PCR 引入变异并筛选,经迭代选择使酶达到工业应用的预期性能。
分子结构与相互作用验证
酶 - 底物复合物的结构与相互作用是验证酶功能与催化效率的关键。尽管实验测定仍是最可靠方法,但成本高昂。当前先进结构预测方法尚不能准确预测所有复合物结构,也无法保证预测的准确性,需结合实验进一步验证。
结论与展望
从头酶设计已取得显著进展,但在创造特定催化功能酶方面成功案例较少(如荧光素酶、磷酸丙糖异构酶)。现存挑战包括设计效率低,如 “家族幻觉” 策略需大量筛选才能获得少量活性酶,凸显酶催化依赖精确相互作用的复杂性。未来需进一步整合 AI 与实验方法,提升模型对酶功能的预测与设计能力,推动其在生物制造、医药开发等领域的广泛应用。
利益声明
作者声明无已知可能影响研究的财务利益或个人关系。
致谢
本研究受中央引导地方科技发展基金(24ZYCGSY00030)与国家自然科学基金(32372580)资助。