《Journal of Chromatography A》:Evolution of chromatographic modeling: from mechanistic models to hybrid models with physics-based deep learning
编辑推荐:
基于物理的深度学习(PBDL)在色谱建模中的三阶段演进:代理求解器通过数据辅助物理实现加速计算但依赖合成数据;物理信息神经网络(PINNs)通过复合损失函数融合物理定律与实验数据提升精度;可微物理系统(DP)实现物理系统与神经网络的深度互馈,推动实时数字孪生与智能生物过程建模。
陈宇成|陈志远|戴世鹏|谢友平|姚珊静|林东强
福州大学福州海洋研究所海洋生物制造中心,中国福州,350108
摘要
基于物理深度学习(PBDL)的混合建模是一种创新方法,它将机理理解和数据驱动学习相结合,超越了传统色谱模型的局限性。本文系统总结了三代PBDL方法在色谱学中的应用进展。第一代方法采用替代模型,通过机理上采样和快速推理加速模拟过程,但受到间接物理耦合的限制,属于“数据辅助物理”范畴。第二代方法将物理定律嵌入损失函数中,实现物理和数据的同步学习,但在损失平衡和数值积分方面面临挑战,属于“物理约束数据”范畴。第三代方法通过将神经网络集成到数值求解器中,实现高保真建模和基于梯度的优化,实现了“物理与数据之间的相互反馈”。这些进展使色谱模型能够在物理约束下自主学习复杂的吸附行为,为下一代色谱工程的实时数字孪生和智能生物过程建模奠定了基础。
部分内容摘录
引言
传统的色谱模型基于第一性原理,通常被称为机理模型。过去二十年里,机理模型在色谱学中的应用迅速扩展,涵盖了过程开发与优化[1,2]、过程表征[3,4]、实时过程控制[5,6]以及材料可追溯性[7,8]等领域。这些应用引入了日益复杂的过程因素,同时也带来了重大挑战。
替代模型
替代模型是PBDL方法的起点[37]。其核心思想是用快速学习的近似模型替代复杂且计算成本高的偏微分方程(PDE)求解器,从而减轻数值方法的计算负担并提高色谱建模的效率。从概念上讲,替代模型的整体工作流程包括两个主要部分:一个机理PDE求解器和一个用于近似该求解器的替代模型。
物理信息神经网络
物理信息神经网络(PINNs)代表了第二代PBDL方法,由Raissi等人于2017年首次提出[47, 48, 49]。与完全依赖机理模拟进行训练的替代模型不同,PINNs将物理定律直接整合到神经网络的学习过程中。这种混合模型通过一个复合损失函数实现,该函数包含三个部分:PDE损失项,用于确保色谱过程的物理定律得到满足可微分物理
从替代模型到PINNs的演变逐步加强了物理建模与深度学习的融合。然而,如上所述,PINNs的一个主要缺点是与传统数值方法的兼容性较差,无法充分利用数十年来积累的数值计算经验。为解决这一问题,出现了新的范式——可微分物理系统模拟(DP),实现了深度学习与数值方法的更深层次整合。三代混合色谱建模方法的比较分析
为了更好地理解混合机理-数据建模的优势和局限性,本文对三代混合色谱建模方法(替代模型、PINNs和DP)进行了比较分析。表1总结了它们在七个核心建模维度上的关键特征。这三代方法的演变体现了机理-数据融合的不断深入:从替代模型的间接耦合
结论
本文总结了色谱建模从完全机理模型向基于PBDL的混合方法的演变过程。确定了三代PBDL方法:第一代替代模型通过数据辅助物理加速模拟过程,但仍受限于预生成合成数据的依赖性;第二代PINNs通过复合损失函数将物理定律与实验数据相结合,提高了建模效果作者贡献声明
陈宇成:撰写初稿、可视化设计、项目管理、研究实施、资金申请、数据整理、概念构思。陈志远:撰写初稿、研究实施。戴世鹏:撰写与编辑、研究实施。谢友平:撰写与编辑、验证。姚珊静:撰写与编辑、验证、监督、概念构思。林东强:撰写与编辑、验证、监督、项目管理。
利益冲突声明
作者声明没有已知的财务利益冲突或个人关系可能影响本文的研究结果。致谢
本工作得到了福州大学研究启动基金(XRC-25153)、浙江省重点科技项目(2023C03116)以及长三角科技创新共同体联合研究计划(YDZX20253100004005)的支持。