可解释人工神经网络作为软传感器预测连续制粒线中水分含量的研究

【字体: 时间:2025年06月22日 来源:European Journal of Pharmaceutical Sciences 4.3

编辑推荐:

  为解决制药工业中人工神经网络(ANN)黑箱特性导致的信任缺失问题,研究人员开发了基于多层感知器(MLP)和非线性自回归外生输入(NARX)的可解释软传感器,用于连续双螺杆制粒过程中水分含量(CQA)的实时监测。研究表明,两种ANN模型预测精度与近红外(NIR)光谱法相当(RMSEP<1%),并通过SHAP分析实现模型透明化,为制药4.0(Pharma 4.0)提供了成本效益高且可解释的PAT解决方案。

  

在制药行业迈向数字化变革的浪潮中,如何突破传统质量监控技术的局限性成为关键挑战。当前制药生产仍面临两大痛点:一方面,近红外光谱(NIR)等过程分析技术(PAT)虽能实现实时监测,但设备昂贵且无法揭示参数间的相互作用;另一方面,具有强大预测能力的人工神经网络(ANN)常被视为"黑箱",其不可解释性阻碍了在严格监管领域的应用。这种矛盾在连续制药生产(CM)中尤为突出,特别是对于水分含量这类关键质量属性(CQA)的监控,直接关系到最终产品质量。

匈牙利研究团队在《European Journal of Pharmaceutical Sciences》发表的研究,创新性地将可解释人工智能(XAI)引入制药过程监控领域。该团队构建了包含12个输入参数的多层感知器(MLP)和非线性自回归外生输入(NARX)两种ANN模型,仅通过工艺参数(如干燥温度、进料速率等)预测双螺杆湿法制粒后的水分含量。研究采用独特的"正交验证"策略:既与传统NIR光谱法(PLS模型)横向对比,又通过离线干燥失重法(LOD)纵向验证。更突破性的是,首次将SHAP分析应用于制药过程模型解释,破解了ANN的"黑箱"难题。

关键技术方法包括:1) 搭建集成连续生产线(含双螺杆制粒机、流化床干燥器等);2) 开发NIR-PLS模型(RMSEP=0.418%)作为基准;3) 构建MLP(隐藏层1个神经元)和NARX(反馈延迟1)模型;4) 采用Bootstrap重采样(500次)优化模型;5) 应用SHAP值量化参数贡献度。实验设计涵盖6组不同工艺参数的连续生产运行,样本量达2660个数据点。

【NIR光谱基PLS方法的评估】
通过遗传算法优化变量选择建立的6潜变量PLS模型,在校准(R2C=0.989)和预测(R2P=0.949)阶段均表现优异。创新性地设置Hotelling T2和Qresidual阈值(校准最大值×10)实现实时异常检测,成功识别出因颗粒覆盖不足导致的光谱干扰问题。

【MLP模型】
采用贝叶斯正则化训练的MLP在测试集表现(RMSE=0.587%)媲美PLS模型。实际产线验证显示,MLP预测与LOD测量值的RMSE为0.965%,且在NIR监测失效时段仍保持稳定。最具革命性的是SHAP分析揭示:干燥温度(1-3区均值)、气流速、粉末质量流量和液固比(L/S)四大参数贡献度占比超80%,其中L/S比每增加0.01单位可使水分预测值提升0.3%,这与流体力学原理高度吻合。

【NARX模型】
针对时序数据特性优化的NARX模型,虽训练集规模受限(仅2组实验数据),仍达到RMSE=0.347%。在预测新工艺组合时表现稳健(R2=0.8127),但反馈延迟仅设为1(5秒),暗示该系统物料返混程度较低,这解释了为何简单MLP也能取得相当效果。

这项研究标志着制药过程监控进入"可解释AI"新阶段。相比传统NIR方法,ANN软传感器节省90%设备成本,且SHAP分析能直观显示如"当干燥温度从60°C升至80°C时,水分预测值下降1.2%"的因果关系。这种透明化不仅满足监管要求(QbD原则),更赋予工程师"逆向诊断"能力——通过预测偏差反推工艺异常。正如作者Zsombor Kristóf Nagy强调的,该方法为实现"实时放行检测(RTRT)"提供了可审计的AI解决方案,其框架可扩展至结晶、压片等关键单元操作,加速制药4.0的真正落地。未来研究可探索将SHAP分析应用于更复杂的深度神经网络,以及开发适应高返混体系的时序模型。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号