综述:重组蛋白生产的智能培养基优化:实验、建模及人工智能/机器学习驱动策略

《Biotechnology Advances》:Smart culture medium optimization for recombinant protein production: Experimental, modeling, and AI/ML-driven strategies

【字体: 时间:2025年10月16日 来源:Biotechnology Advances 12.5

编辑推荐:

  本综述系统阐述了重组蛋白生产(RPP)中“智能”培养基优化的五大关键阶段(规划、筛选、建模、优化与验证),深入剖析了培养基组分(碳源、氮源、氨基酸、盐类、微量元素)的营养与能量作用及其对培养参数(pH、氧化状态、渗透压)的影响,强调了实验设计(DoE)、建模技术与人工智能/机器学习(AI/ML)驱动策略在提升蛋白产量、质量并降低成本方面的变革性潜力。

  
Stages of medium optimization
培养基优化流程遵循五个核心阶段:规划、筛选、建模、优化与验证。其复杂程度取决于所研究的培养基组分(因素)及其测试浓度范围(水平)的数量。
Defining the objectives and response variables
培养基优化可被表述为一个数学优化问题。培养基包含n种不同组分,响应变量(y)是各组分浓度(xi)的函数。优化目标根据具体应用和目标蛋白而定,例如,目标可能是最大化蛋白产量(如单位体积产量或比生产率)、优化蛋白质量属性(如糖基化模式、电荷变体、聚集水平),或最小化生产成本。
Screening and experimental execution
筛选阶段旨在通过实验识别对响应变量有显著统计学影响的培养基组分(因素)。所选组分会在不同浓度(水平)下进行测试。受时间和资源限制,因素、水平及重复实验的数量均需精心设计。筛选研究的培养容器和条件取决于宿主菌株和测试因素的数量,从摇瓶、微孔板到生物反应器系统均可选用,其中高通量系统能极大加速实验进程。实验设计(DoE)方法是该阶段的基石,例如Plackett-Burman设计可用于筛选重要因素,而响应面法(RSM)则用于研究因素间的相互作用并建立模型。
Modeling
筛选出重要组分及其水平后,可采用多种建模技术来建立它们与重组蛋白生产(RPP)之间的关联函数。这些模型为后续的优化步骤提供基础。常用的方法包括基于机理的动力学模型(如Monod方程描述细胞生长)、统计模型(如RSM建立的多项式方程)以及日益兴起的人工智能/机器学习(AI/ML)模型(如随机森林、神经网络、高斯过程等)。AI/ML模型尤其擅长处理高维、非线性的复杂生物过程数据,并能从有限的数据集中提取有效信息进行预测。
Optimization and validation
模型建立后,即可通过优化算法(如RSM、贝叶斯优化、遗传算法等)来微调重要培养基组分的浓度,以确定最大化蛋白产量的最优培养基配方。这些方法不仅能找到最优浓度,还能识别组分间显著的交互效应。随后,必须在相关的培养系统中对模型预测的最优配方进行实验验证,以评估其性能。验证结果可为模型提供反馈,用于进一步的训练和 refinement(精炼),从而形成一个“学习-预测-验证”的迭代优化闭环。
Active learning
主动学习(Active Learning)是一种机器学习策略,其算法会迭代地选择信息量最大的数据点进行实验“标注”,从而以最少的标记数据优化模型性能。该策略特别适用于培养基优化,因为其组合搜索空间极大而实验资源有限。通过迭代地整合实验验证与机器学习预测,基于有限数据训练的模型可逐步改进,高效地导航复杂的实验空间,加速找到全局最优解。
Complex raw materials
在实验室规模获取化学成分确定的纯原料相对容易,但在商业规模上获取稳定且足量的原材料则复杂得多。原材料的供应必须能满足工业规模的需求,并且其质量在必要的储存期内必须保持稳定。农业、制药、食品和酿造行业的废弃物和副产品可作为低成本培养基组分的替代来源,但其可变性和复杂性给工艺的稳健性带来了挑战,需要额外的处理和质量控制步骤。
Conclusion
重组蛋白(RPP)广泛应用于生物技术各行业,其市场规模正在迅速扩大。然而,蛋白产量与质量的限制以及高昂的生产成本仍然是重大挑战。培养基原材料是RPP总成本的最主要贡献者之一。优化培养基组成对于提高蛋白产量、保证质量(如正确的翻译后修饰(PTMs)和折叠)以及降低成本和环境影响至关重要。传统的“试错”优化方法耗时费力。本综述概述的智能优化框架——整合了实验设计(DoE)、建模、人工智能/机器学习(AI/ML)和主动学习——为加速这一过程提供了强大的变革性工具。尽管在将实验室规模的优化成果转化为工业应用时面临挑战(如原材料复杂性、规模放大效应),但未来的AI/ML驱动方法有望克服当前瓶颈,为RPP加速设计出更高效、更经济、更可持续的智能培养基。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号