基于自动机器学习(AutoML)的哺乳动物灌流培养氨基酸实时监测软传感器开发与应用

【字体: 时间:2025年08月06日 来源:Biotechnology and Bioengineering 3.6

编辑推荐:

  本文推荐:该研究创新性地采用自动机器学习(AutoML)框架开发软传感器,实现哺乳动物灌流培养中17种氨基酸的实时监测。通过TPOT工具优化特征工程和模型算法,结合时间预算调参和辅助氨基酸测量,显著提升预测精度(R2达0.943±0.082),为生物制造过程分析技术(PAT)和数字孪生(DT)系统提供关键技术支撑。

  

基于AutoML的氨基酸监测技术突破

在生物制药领域,哺乳动物灌流培养凭借其高细胞密度和持续生产力优势,正逐步取代传统分批培养模式。然而这种连续培养系统对过程稳定性要求极高,特别是氨基酸作为关键营养物质和代谢指标,其浓度波动直接影响细胞生长、产物滴度和关键质量属性(CQAs)。传统分析方法受限于检测灵敏度和光谱重叠等问题,难以实现实时监测。本研究开创性地应用自动机器学习(AutoML)技术,开发出高效预测氨基酸浓度的软传感器系统。

创新性技术框架构建

研究采用树形管道优化工具(TPOT)构建AutoML框架,通过进化算法在100代内优化机器学习管道。该系统整合14种特征预处理方法(包括MaxAbsScaler、PCA等)和4种特征选择器,自动匹配12种算法组合,涵盖线性回归(LASSO、Elastic Net)、支持向量回归(SVR)和集成学习(XGBoost、随机森林)等。在CHO细胞灌流培养数据集(10个批次130个样本)上,仅需7个日常测量参数(VCD、葡萄糖、乳酸等)即可预测17种氨基酸浓度。

性能优化关键发现

初始30分钟时间预算下,天冬酰胺传感器展现卓越性能(R2=0.988±0.008),而组氨酸等传感器表现欠佳(R2=0.608±0.186)。通过系统分析发现:

  1. 时间预算调参使赖氨酸传感器性能提升24%(R2从0.656升至0.814)

  2. 引入异亮氨酸测量使最低性能传感器提升35%(苯丙氨酸R2从0.694升至0.977)

  3. 特征工程使特征空间与标签空间相似性提升(RankSim损失降低62%)

  4. 数据表征连续性显著改善(RNC损失下降58%)

代谢机制与模型关联

研究揭示模型性能与氨基酸代谢功能高度相关:

  • 高精度预测的天冬酰胺和精氨酸是TCA循环关键底物

  • 难预测的苯丙氨酸和色氨酸主要参与产物质量调控

  • 异亮氨酸作为最佳辅助输入,通过L-系统转运体激活其他氨基酸摄取

技术局限与未来方向

当前框架存在三方面局限:

  1. 数据规模限制(仅单克隆CHO细胞数据)

  2. 黑箱特性影响GMP环境下的可解释性

  3. 时间预算过长导致的元过拟合(如脯氨酸传感器)

建议通过以下途径改进:

  • 整合代谢网络模型增强生物学解释性

  • 采用SHAP等可解释AI工具

  • 开发跨细胞系和培养模式的迁移学习策略

工业应用前景

该技术已展示出在数字孪生系统中的实施潜力:

  1. 线性模型占比达68%,利于实时部署

  2. 预测误差普遍低于7%(MAE=0.009-0.048)

  3. 支持PAT框架下的闭环控制

这项研究为生物制药4.0时代提供了关键的过程分析工具,通过自动化机器学习实现了传统方法难以企及的氨基酸监测精度,为质量源于设计(QbD)理念的落地实践开辟了新路径。未来通过与机理模型的融合,有望构建真正自主决策的智能生物制造系统。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号