机器学习驱动的半自动化培养基优化:揭示盐是恶臭假单胞菌生产黄酮菌素的关键因素

【字体: 时间:2025年04月19日 来源:Communications Biology 5.2

编辑推荐:

  在合成生物学领域,其发展受限于缺乏预测能力,培养基优化对获取商业可行的生产指标至关重要却常被忽视。研究人员开展了基于机器学习的半自动化培养基优化研究,用该方法优化恶臭假单胞菌生产黄酮菌素的培养基,发现 NaCl 是关键,显著提升生产指标,为合成生物学研究提供新策略。

  在生物制造的奇妙世界里,合成生物学宛如一颗闪耀的新星,它怀揣着用可再生方式生产宝贵化学品的梦想,比如制造出用于衣物的合成丝绸、无肉却有肉味的汉堡,还有对抗疟疾和癌症的药物等。然而,这颗新星却被缺乏预测能力的乌云所笼罩。在合成生物学的流程中,培养基优化这一关键环节,就像被遗落在角落里的宝藏,常常被人们忽视。培养基优化旨在寻找能实现最大生产水平的最优培养基,这对于获得商业生产所需的高滴度、高产量和高转化率(TRY)至关重要。但传统的优化方法,如一次只改变一种成分的实验方式,不仅耗时费力,而且效果不佳,还容易忽略途径、宿主和培养基的共同优化。
为了驱散这团乌云,挖掘出培养基优化的宝藏,来自劳伦斯伯克利国家实验室(Lawrence Berkeley National Laboratory)、能源部敏捷生物铸造厂(DOE Agile BioFoundry)等多个机构的研究人员挺身而出,开展了一项极具创新性的研究。他们将机器学习与自动化巧妙结合,构建了一个半自动化的活性学习流程,用于优化培养基。这项研究成果发表在《Communications Biology》上,犹如一道曙光,为合成生物学的发展带来了新的希望。

研究人员在开展研究时,主要运用了以下几种关键技术方法:首先是构建了一套半自动化的数据生成管道,该管道能够在三天内对多达 15 种培养基设计进行重复测试,为后续的机器学习提供了高质量的数据支持;其次,利用可解释人工智能(AI)技术中的 SHapley Additive exPlanations(SHAP)分析,确定了影响黄酮菌素生产的关键培养基成分;此外,通过主成分分析(PCA)来可视化培养基相空间,探究不同实验中培养基成分的变化规律 。

下面让我们深入了解一下这项研究的具体成果:

  • 半自动化数据生成管道的开发:研究人员精心打造了一个半自动化管道,它就像一个高效的生产机器,能在三天内对 15 种培养基设计进行三到四次重复测试。这个管道自动化了培养基优化过程的大部分步骤,从培养基的合成、菌株的接种培养,到产物黄酮菌素的测量,都能有条不紊地进行。而且,它还具备高度的可重复性,无论是在同一实验周期内,还是不同周期之间,甚至不同用户操作时,都能保证实验结果的稳定可靠。这为机器学习算法提供了充足且高质量的数据,就像给机器注入了强大的动力,使其能够有效地指导工程化生产过程。
  • 应用管道显著提高黄酮菌素产量:借助这个半自动化平台,研究人员开展了三个不同的实验项目(C1、C2、C3)。在这些项目中,他们成功地将黄酮菌素的滴度分别提高了 60%(以 Abs340测量为 148%)、70%(以 Abs340测量为 170%),将生产过程的产率提高了 350%(以 Abs340测量为 300%)。在优化过程中,研究人员发现所有项目都趋向于培养基相空间的相似区域,而且表现最佳的培养基中 NaCl 浓度极高,接近恶臭假单胞菌(P. putida)所能耐受的极限。同时,他们还发现葡萄糖浓度会影响滴度和产率之间的平衡,而较高的 NaCl 浓度可以缓解这种平衡的冲突。
  • 特征重要性分析表明盐胁迫是提高产量的主要驱动力:通过 SHAP 分析,研究人员发现培养基中 12 种(或 13 种,取决于实验)可变成分中,只有 5 种对黄酮菌素的生产起着重要作用,其中 NaCl 的影响最为关键。在所有实验项目中,表现最佳的培养基中 NaCl 浓度是起始培养基的 8 - 9.2 倍。这一发现与传统基于质量作用动力学和转录组学分析的认知相悖,凸显了数据驱动方法的独特优势,能揭示出传统方法难以发现的规律。
  • ART 在引导优化过程中优于其他先进方法:研究人员使用合成数据将自动化推荐工具(ART)与其他两种先进算法 JMP 和 gpCAM 进行对比。结果显示,在引导模拟的活性学习过程中,ART 在处理不同复杂程度的函数时,总体表现更优。它能够用更少的数据点获得相似的结果,或者取得更好的结果,这对于数据获取成本高昂的合成生物学领域来说,无疑具有重要的意义。

在研究结论和讨论部分,研究人员指出,活性学习能够以一种与宿主、产物和途径无关的系统方式优化培养基,不仅显著提高了生产效率,还发现了意想不到的关键培养基成分 ——NaCl。这一发现为生物制造开辟了新的可能性,比如可以考虑使用微咸水作为生产环境,从而降低生产成本和环境影响。同时,研究还表明,即使是不完美的测量指标(如 Abs340),在加速活性学习过程方面也可能具有重要价值。

此外,该研究中活性学习的响应提升并非单调递增,而是呈现出爆发性和不可预测性。这一现象提示我们,在实际应用中,确定何时结束一个实验项目并非易事。实验的可重复性对于活性学习的正常运行至关重要,而他们精心设计的半自动化管道恰好满足了这一需求,有效减少了实验误差,提高了实验效率。

总的来说,这项研究为合成生物学的发展提供了新的思路和方法,展示了机器学习和自动化技术在生物工程领域的巨大潜力。它就像一把钥匙,打开了合成生物学高效发展的新大门,为实现商业可行的生物制造提供了有力的支持,也为未来相关领域的研究指明了方向。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号