
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于自动机器学习(AutoML)的哺乳动物灌流培养氨基酸实时监测软传感器开发与应用
【字体: 大 中 小 】 时间:2025年08月06日 来源:Biotechnology and Bioengineering 3.6
编辑推荐:
本文推荐:该研究创新性地采用自动机器学习(AutoML)框架开发软传感器,实现哺乳动物灌流培养中17种氨基酸的实时监测。通过TPOT工具优化特征工程和模型算法,结合时间预算调参和辅助氨基酸测量,显著提升预测精度(R2达0.943±0.082),为生物制造过程分析技术(PAT)和数字孪生(DT)系统提供关键技术支撑。
基于AutoML的氨基酸监测技术突破
在生物制药领域,哺乳动物灌流培养凭借其高细胞密度和持续生产力优势,正逐步取代传统分批培养模式。然而这种连续培养系统对过程稳定性要求极高,特别是氨基酸作为关键营养物质和代谢指标,其浓度波动直接影响细胞生长、产物滴度和关键质量属性(CQAs)。传统分析方法受限于检测灵敏度和光谱重叠等问题,难以实现实时监测。本研究开创性地应用自动机器学习(AutoML)技术,开发出高效预测氨基酸浓度的软传感器系统。
创新性技术框架构建
研究采用树形管道优化工具(TPOT)构建AutoML框架,通过进化算法在100代内优化机器学习管道。该系统整合14种特征预处理方法(包括MaxAbsScaler、PCA等)和4种特征选择器,自动匹配12种算法组合,涵盖线性回归(LASSO、Elastic Net)、支持向量回归(SVR)和集成学习(XGBoost、随机森林)等。在CHO细胞灌流培养数据集(10个批次130个样本)上,仅需7个日常测量参数(VCD、葡萄糖、乳酸等)即可预测17种氨基酸浓度。
性能优化关键发现
初始30分钟时间预算下,天冬酰胺传感器展现卓越性能(R2=0.988±0.008),而组氨酸等传感器表现欠佳(R2=0.608±0.186)。通过系统分析发现:
时间预算调参使赖氨酸传感器性能提升24%(R2从0.656升至0.814)
引入异亮氨酸测量使最低性能传感器提升35%(苯丙氨酸R2从0.694升至0.977)
特征工程使特征空间与标签空间相似性提升(RankSim损失降低62%)
数据表征连续性显著改善(RNC损失下降58%)
代谢机制与模型关联
研究揭示模型性能与氨基酸代谢功能高度相关:
高精度预测的天冬酰胺和精氨酸是TCA循环关键底物
难预测的苯丙氨酸和色氨酸主要参与产物质量调控
异亮氨酸作为最佳辅助输入,通过L-系统转运体激活其他氨基酸摄取
技术局限与未来方向
当前框架存在三方面局限:
数据规模限制(仅单克隆CHO细胞数据)
黑箱特性影响GMP环境下的可解释性
时间预算过长导致的元过拟合(如脯氨酸传感器)
建议通过以下途径改进:
整合代谢网络模型增强生物学解释性
采用SHAP等可解释AI工具
开发跨细胞系和培养模式的迁移学习策略
工业应用前景
该技术已展示出在数字孪生系统中的实施潜力:
线性模型占比达68%,利于实时部署
预测误差普遍低于7%(MAE=0.009-0.048)
支持PAT框架下的闭环控制
这项研究为生物制药4.0时代提供了关键的过程分析工具,通过自动化机器学习实现了传统方法难以企及的氨基酸监测精度,为质量源于设计(QbD)理念的落地实践开辟了新路径。未来通过与机理模型的融合,有望构建真正自主决策的智能生物制造系统。
生物通微信公众号
知名企业招聘