PLSTM-MTGF:一种深度学习融合模型,通过近红外光谱技术实现青霉素发酵过程的实时多目标监测

《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》:PLSTM-MTGF: A deep learning fusion model enabling real-time multi-target monitoring of penicillin fermentation via near-infrared spectroscopy

【字体: 时间:2025年12月18日 来源:Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy 4.3

编辑推荐:

  实时多参数监测对优化工业青霉素发酵至关重要,但传统方法存在效率低、易污染问题。本研究提出轻量级PLSTM-MTGF模型,融合PLSR光谱压缩与LSTM-Attention时序建模,通过多任务门融合机制实现糖、氮、密度和效价四参数在线监测。在24批次严格评估中,模型表现优异(R2达0.98,RPD>3),且参数量仅0.97M,支持实时CPU推理。化学计量学与深度学习融合有效解决了多目标在线分析难题。

  
Nan Shen|Jianxia Wang|Xiaojun Wang|Jinlong Ma|Shaoguang Wu
河北科技大学信息科学与工程学院,石家庄,中国

摘要

实时、多参数监测对于优化工业青霉素发酵过程至关重要,然而传统的检测方法速度较慢且容易受到污染。本研究提出了一种轻量级的双流融合模型——部分最小二乘回归-长短期记忆与多任务门控融合(PLSTM-MTGF)——通过近红外光谱技术在线监测四个关键指标:残余糖、氨基氮、细胞密度和青霉素效力。该模型结合了部分最小二乘回归进行光谱压缩,并利用长短期记忆-自注意力网络捕捉过程动态,同时采用多任务门控融合机制来平衡各任务的表示。在24个工业批次的数据上进行评估,该模型在所有指标上均表现出高准确性(R2 = 0.89–0.98;RPD = 3.0–7.1),优于传统的线性模型和深度学习基准。消融实验验证了光谱流和时间流以及门控策略的必要性。该模型参数量仅为0.97 M,可在标准CPU上实现实时推理,便于常规生物过程监测。这些结果证明了将化学计量学与深度学习相结合可以为多目标、在线生物过程分析提供一种稳健且可解释的方法。

引言

青霉素是首个临床应用的抗生素,在对抗细菌感染方面仍然至关重要[1]。预计到2025年,中国的工业青霉素盐年生产能力将超过10万吨,因此优化其制造过程具有重要的经济和实际意义。在工业发酵过程中,必须监测关键生理指标以指导控制措施。具体而言,残余糖决定了碳的充足性和底物分解的抑制;氨基氮(AN)调节从生物量增长到次级代谢的转变;细胞密度影响氧气需求和培养基的流变特性;而青霉素效力是主要的质量指标。跟踪这些变量有助于做出关于进料、通气和pH值的明智决策,从而促进从生长到生产的有效转换[2]。然而,传统的分析方法依赖于手动采样和高性能液相色谱(HPLC)等检测技术[3],这些方法速度慢、劳动强度高且存在污染风险[4]。
近红外光谱(NIR)基于C-H、O-H和N-H键的振动[5, [6], [7],提供了一种快速、无损且实时的检测方法,适用于原位、无菌操作[8, [9], [10], [11]]。尽管NIR已在生物过程分析中得到广泛应用[12, [13], [14], [15]],但在青霉素发酵中的应用主要集中在使用静态化学计量模型进行单一分析物的定量[16, [17], [18]],尽管有研究认为NIR也适用于微生物过程中的多参数在线监测[19]。
工业应用中的一个实际挑战在于传统预处理(如平滑处理、基线校正、标准正态变量变换(SNV))和波长选择的复杂性[20], [21], [22],以及这些模型一次只能预测一个目标的局限性[23],这限制了实时多目标控制的稳健性和实用性。
为了解决上述问题,本研究提出了PLSTM-MTGF(部分最小二乘回归和长短期记忆与多任务门控融合)模型。该模型的目标是为工业青霉素发酵提供基于NIR的实时多目标监测框架,其重要性在于能够实现可靠的在线估计,从而推动闭环控制(如进料和pH值调节),提高效率和产品质量。方法上的贡献有三方面:(i)在单一模型中联合估计四个关键指标,而非针对单一分析物进行校准;(ii)通过多任务门控机制明确融合光谱压缩(PLSR)和时间动态(LSTM/注意力);(iii)采用轻量级实现进行严格的批次评估,并实现实时CPU推理。该模型在发酵过程中持续接收和处理在线NIR光谱数据;通过分析预测的指标(如残余糖和氨基氮),支持即时反馈控制,以维持最佳条件并提高发酵效率和最终产品质量。

样本数据

样本数据

样本数据来自山西省大同市的一家制药厂,使用在线近红外光谱(NIRS)仪器采集。在青霉素发酵过程中的多个时间点采集了样本。目标参数的参考值是通过标准分析方法获得的。数据集包含488个样本,每个样本关联四个指标:残余糖(g·L?1)、氨基氮(AN,g·L?1)、细胞密度(OD)和青霉素效力(IU·mL?1)。

结果

根据图1所示不同批次中四个发酵指标的时间曲线,488个样本涵盖了24个发酵批次。为了确保模型评估的严格性并防止信息泄露,采用了严格的批次划分策略:前20个批次作为训练集,其余4个批次作为测试集。在训练阶段,首先使用训练数据识别并移除了异常样本

讨论

所提出的PLSTM-MTGF模型表明,在统一的融合架构中整合化学计量学和深度学习方法为工业发酵过程的准确多参数监测提供了可行的途径。这项工作并不引入全新的算法,而是侧重于架构创新:通过PLSR实现光谱域的去相关,利用LSTM-Attention建模时间依赖性,并通过自适应特征加权

结论

本研究开发了一种基于在线NIR的PLSTM-MTGF模型,用于青霉素发酵的实时多目标监测。通过对24个发酵批次进行严格批次评估,该模型在残余糖、氨基氮、细胞密度和青霉素效力方面的预测准确性很高(R2高达0.981;RMSE低至0.012 g·L?1 / 1.811 OD / 4687 IU·mL?1;RPD高达7.114)。与在同一波长子集上训练的传统化学计量学和深度学习基准相比,

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号