AI驱动无细胞蛋白质合成优化:ChatGPT-4自动生成代码与主动学习策略实现抗菌蛋白产量提升

【字体: 时间:2025年10月07日 来源:iScience 4.1

编辑推荐:

  本研究针对无细胞蛋白质合成(CFPS)系统优化过程中实验组合庞大、耗时耗力的问题,开发了一种全自动设计-构建-测试-学习(DBTL)工作流。研究人员利用ChatGPT-4直接生成实验设计代码,结合改进的聚类边界主动学习策略,成功将大肠杆菌和HeLa基CFPS系统中colicin M和E1的产量分别提高2-9倍。该研究为合成生物学提供了高效、自动化的优化平台,显著加速了抗菌蛋白的生产与应用。

  
在合成生物学领域,无细胞蛋白质合成(Cell-Free Protein Synthesis, CFPS)技术因其快速原型构建能力而备受关注。然而,面对海量的组分组合,传统优化方法犹如大海捞针,不仅耗时费力,还严重依赖研究人员经验。特别是在抗菌蛋白生产中,如何快速获得高产量、高活性的产物,成为制约其应用的关键瓶颈。
为此,Khalil等研究人员在《iScience》发表了一项创新研究,他们巧妙融合人工智能、自动化实验和合成生物学技术,开发了一套全自动化的优化工作流。该研究的独特之处在于,首次实现使用ChatGPT-4直接生成实验设计代码且无需人工修改,大大降低了编程门槛,使更多非计算机背景的研究人员能够快速搭建复杂实验平台。
研究团队采用了几项关键技术:一是基于聚类边界(Cluster Margin)的主动学习(Active Learning, AL)策略,通过高斯过程回归(Gaussian Process Regression)模型,在保证样本多样性的同时优先选择最具信息量的实验条件;二是集成Galaxy平台的模块化工作流,确保实验的可重复性和FAIR(可查找、可访问、可互操作、可重用)原则;三是建立双检测系统——分裂绿色荧光蛋白(split-GFP)荧光系统和HiBiT发光系统,分别用于原核和真核CFPS系统的蛋白质定量与功能验证。
优化无细胞蛋白质合成系统生产力
研究人员首先针对大肠杆菌基CFPS(proCFPS)系统,聚焦9个关键组分的浓度优化,探索了超过千万种可能的组合。通过四轮主动学习循环,colicin M产量获得高达9倍的提升,而colicin E1也实现了3倍的产量增长。在HeLa基CFPS(euCFPS)系统中,尽管其产量相对较低,但仍实现了2倍的提升,且优化后的缓冲液配方在保持性能的同时降低了试剂成本。
检测和定量无细胞合成蛋白质
团队设计了两套检测系统:split-GFP系统通过GFP11标签与colicin融合,与GFP1-10片段共表达后恢复荧光;HiBiT系统则通过HiBiT标签与colicin融合,加入LgBiT大亚基和底物后产生发光信号。实验表明,发光检测在低蛋白量(0-1 ng)范围内具有更好的线性响应,而荧光检测适合实时监测蛋白质合成动力学。
测量合成蛋白质的活性
通过细菌生长抑制实验验证了合成colicin的生物活性。结果显示,proCFPS系统中仅需78-780 ng的colicin即可显著抑制大肠杆菌W3110菌株的生长;euCFPS系统中甚至仅需4.5-36 ng的colicin就表现出剂量依赖性的抑菌效果,证明即使低产量系统也能产生具有功能活性的抗菌蛋白。
研究结论表明,这种AI驱动的自动化工作流不仅大幅减少了实验次数,还显著提高了优化效率。特别是ChatGPT-4生成的代码无需修改即可直接使用,突破了传统编程壁垒,为生物学家提供了强大工具。聚类边界主动学习策略相比传统方法,在减少50-60%数据点的情况下达到了相近甚至更好的模型性能,体现了其高效性。
讨论部分指出,该研究的局限性在于CFPS系统与活细胞工程存在本质差异,且系统本身存在变异性。未来工作可进一步自动化湿实验步骤,减少人为干预,并探索将CFPS输出与细胞底盘设计相结合。尽管如此,这项研究为下一代生物铸造厂奠定了坚实基础,通过整合分子生物学、自动化和人工智能,有力推动了合成生物学研究和生物制造的发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号