人工智能驱动的自主酶工程通用平台:实现高效蛋白质功能改造的新范式

【字体: 时间:2025年07月02日 来源:Nature Communications 14.7

编辑推荐:

  研究人员开发了一个整合机器学习(ML)、大语言模型(LLMs)与生物铸造厂自动化(iBioFAB)的通用平台,成功实现了无需人工干预的自主酶工程。通过四轮迭代优化,将拟南芥卤代甲基转移酶(AtHMT)的乙基转移活性提升16倍,中性条件下耶尔森菌植酸酶(YmPhytase)活性提高26倍。该研究为合成生物学领域提供了可扩展的自动化解决方案。

  

在生命科学领域,蛋白质作为生命的分子机器,在能源、健康和可持续发展中具有广泛应用。然而,传统蛋白质工程方法存在效率低、成本高、依赖专家经验等瓶颈问题。特别是在酶工程领域,如何快速获得具有特定功能的工程化酶仍是重大挑战。现有自动化平台往往局限于特定目标或依赖外部云实验室,缺乏通用性和透明度。这些限制严重阻碍了合成生物学在医药、生物技术和可再生能源等领域的应用发展。

针对这些问题,美国伊利诺伊大学厄巴纳-香槟分校的研究团队开发了一个通用的人工智能驱动自主酶工程平台。该研究通过整合蛋白质语言模型、机器学习算法和全自动化生物铸造厂,实现了从设计到测试的闭环优化系统。相关成果发表在《Nature Communications》上,为合成生物学领域提供了革命性的研究范式。

研究采用了三项关键技术:1) 使用ESM-2蛋白质语言模型和EVmutation统计模型进行零样本突变预测;2) 基于Illinois Biological Foundry for Advanced Biomanufacturing(iBioFAB)建立全自动化实验流程,包括HiFi组装定点突变、96孔板转化和酶活性检测;3) 采用低样本量(low-N)监督学习模型进行迭代优化。研究选用拟南芥卤代甲基转移酶(AtHMT)和耶尔森菌植酸酶(YmPhytase)作为模式系统,分别针对底物选择性和pH适应性进行优化。

自动化构建与表征蛋白质变体

研究团队开发了基于HiFi组装的定点突变方法,突变准确率达95%。通过将工作流程划分为七个自动化模块,实现了从突变设计到功能检测的无缝衔接。其中关键创新是消除了测序验证环节,使工程周期缩短至7天。

蛋白质变体设计策略

初始文库设计结合了ESM-2和EVmutation两种无监督模型,AtHMT和YmPhytase分别获得59.6%和55%优于野生型的变体。从第二轮开始采用监督学习模型预测新突变组合,发现模型能识别人类直觉难以发现的协同突变效应。

ML指导下的新发现

研究发现了若干反直觉的结果:在AtHMT工程中,尽管S99T/V140T双突变体表现优异,但包含该组合的三突变体仅有11%优于V140T单突变体,而模型预测的三突变体有82%显著更优。这显示机器学习能识别人类难以预测的突变协同效应。

工程化酶的显著改进

经过四轮优化(共构建446个AtHMT和448个YmPhytase变体),获得AtHMT变体V140T/L101I/E206D/S63N,其乙基转移活性提高16倍;另一变体对乙基碘的偏好性提高90倍。YmPhytase变体V141M/K226G/I15V/Q362R在中性pH下活性提升26.3倍。这些改进远超此前半理性设计获得的最佳变体。

语言模型用户界面

研究还开发了基于自然语言的用户界面,通过OpenAI助手API实现非技术人员的平台操作,显著降低了使用门槛。

该研究建立了首个真正通用的自主酶工程平台,仅需输入蛋白质序列和可量化活性指标即可完成优化。其重要意义在于:1) 突破了传统蛋白质工程对专业知识的依赖;2) 通过模块化设计实现了技术普适性;3) 为合成生物学自动化研究提供了可扩展框架。虽然当前平台在预测模型普适性和相邻突变引入方面存在局限,但随着AI模型的发展,该平台有望拓展至更复杂的蛋白质工程挑战。这项工作将加速从药物开发到可持续化学等领域的创新进程。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号