基于可解释AI的模型结构迁移学习加速生物过程模型构建

【字体: 时间:2025年07月21日 来源:Biotechnology and Bioengineering 3.6

编辑推荐:

  这篇综述提出了一种结合符号回归(SR)和人工神经网络(ANN)特征归因的新型模型结构迁移学习方法,通过自动修正源系统的机理模型结构,显著提高了目标生物过程动力学模型的预测精度。该方法突破了传统黑箱迁移学习缺乏可解释性的局限,通过嵌入ANN修正项定位结构缺陷,再转化为可解释的符号表达式,实现了从Monod到Contois动力学的自动转换。研究通过酵母发酵产虾青素的案例验证,表明该方法能有效识别内源生物量衰减(μdX)和产物逆转(kdX2)等关键修正项,结合基于模型的设计实验(MbDoE)可将平均绝对百分比误差(MAPE)从23%降至10.7%。

  

引言

开发能准确预测生物过程动态的动力学模型对商业化工艺设计至关重要。传统方法依赖人工从文献或经验中探索模型结构,耗时数周;而数据驱动方法虽快速部署却缺乏可解释性。当前混合建模和迁移学习虽能部分解决这些问题,但前者存在过拟合风险,后者仅更新参数而忽略关键结构差异。

方法论

提出的框架包含四步创新流程:

  1. ANN修正定位:在机理方程叶节点嵌入修正项φ,通过方差分析(φ?j>0.1)筛选关键位点
  2. 特征归因:采用积分梯度法识别影响最大的输入特征,如生物量(X)对产物逆转项的支配性影响(πX12=0.82)
  3. 符号回归:用遗传编程构建如?12=-kdX2的显式修正,复杂度限制在Cmax=7个运算符
  4. 参数微调:通过L2正则化消除冗余项,如将?2=X+0.4简化为标准Contois形式

案例验证

以酵母产虾青素为例,源系统采用Monod动力学(μ=μmS/(S+KS)),目标系统需转换为Contois形式(含X项)。结果显示:

  • 高先验场景:3次结构修正迭代后,80%案例准确识别μd=0.1 h-1的衰减项
  • 低先验场景:从仅含μX的简化模型出发,经MbDoE设计的13组实验后,MAPE从18.7%降至5.5%

技术优势

相比传统方法,该框架具有三大突破:

  1. 物理可解释性:通过对比修正前后的模型结构,可发现如产物抑制等新机制
  2. 小数据适配:仅需6-8组实验数据,采样频率可放宽至12小时/次
  3. 计算高效性:在NVIDIA RTX A1000上单次修正仅需20秒

应用前景

该方法特别适用于:

  • 菌株改造时的快速模型迁移
  • 生物反应器配置变更的数字孪生构建
  • 监管要求严格的制药领域

研究通过系统化的结构修正和实验设计,为生物过程建模提供了兼具精度与解释性的新范式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号