基于多层感知器(MLP)校准中预测不确定性估计的自助法辅助新策略

【字体: 时间:2025年03月31日 来源:Analytica Chimica Acta 5.7

编辑推荐:

  本文提出结合德尔塔法与自助法,用于估计 MLP 校准模型中预测浓度的不确定性。通过模拟数据集验证,该方法为 ANN 校准模型表征提供关键支持,对提升分析结果报告质量、推动分析方法产业转化意义重大。

  

引言

在分析化学领域,利用光谱技术开发多元校准方法十分常见。像主成分回归(PCR)和偏最小二乘回归(PLS)这类常用的化学计量学算法,通常依据比尔 - 朗伯定律,假设信号与浓度之间存在线性关系。然而,由于实验或物理化学方面的问题,可能会出现非线性偏差,此时就需要更灵活的建模方法,人工神经网络(ANNs)尤其是多层感知器(MLP)便受到关注。
MLP 作为经典的 ANNs 之一,因其算法成熟、公式直观且易于实现,在校准文献中频繁出现。当线性假设不成立时,MLP 相比线性模型具有更出色的预测能力。但目前基于 MLP 的分析方法在验证方面存在局限,主要原因是缺乏全面的统计表征,难以估计分析品质因数(AFOMs)。AFOMs 是方法验证的关键参数,包括灵敏度、分析灵敏度、选择性、预测不确定性、检测限(LOD)和定量限(LOQ)等,与分析方法的准确性和精密度密切相关。虽然在过去几十年中,针对各种校准场景和化学计量学模型计算 AFOMs 的理论有了很大发展,但大多局限于线性领域。
近年来,ANNs 的不确定性研究虽有不少进展,如灵敏度分析用于模型优化和变量选择,误差传播用于分类的稳健性分析,还有蒙特卡罗、贝叶斯随机失活(Bayesian dropout)和集成方法等,但这些研究大多未涉及分析校准领域,或并非专门针对 MLP。尽管如此,不确定性传播理念为估计 ANN 校准模型中的 AFOMs 提供了思路。此前,虽有研究提出了基于径向基函数(RBF)校准的 AFOMs 方程,以及 MLP 校准中分析灵敏度的估计方法,但对 MLP 关于 AFOMs 的完整表征仍未完成。
在不确定性估计方面,Faber 和 Kowalski 于 1997 年提出的误差传播理论意义重大,该理论考虑了浓度和预测变量(仪器或光谱信号)的误差。不过,将其扩展到非线性模型预测浓度方差估计时,通过经典估计方法推导解析表达式在数学上颇具挑战。自助法作为一种数值统计重采样技术,无需假设分布,为解决这一问题提供了新途径,但在基于 MLP 的校准中尚未得到充分探索。
本文旨在结合德尔塔法和自助法,提出一种稳健的方法,用于估计基于 MLP 校准模型中预测浓度的不确定性。其中,德尔塔法用于推导考虑浓度和仪器变量误差的方差结构通用表达式,自助法用于估计模型估计带来的变异性。通过模拟多个非线性多元校准数据集进行验证,并将结果应用于量化测试样本的预测不确定性,探讨实验非线性光谱数据集中的精度问题。

理论

Faber 和 Kowalski 的研究是多元校准模型不确定性研究的基石,其考虑了浓度和仪器变量带来的误差。假设代表分析信号,代表浓度,在模型下,是测量变量,满足,这里是实验误差,那么线性一阶多元校准模型的通用表达式为

模拟数据生成

研究模拟了不同的一阶光谱类非线性多元校准数据集,每个数据集分别包含 2 个或 3 个成分。在 60 个传感器的光谱工作范围内,单位浓度光谱轮廓部分重叠。其中,成分 1(,蓝色轮廓)在所有情况下均代表用于浓度预测的分析物;成分 2(,红色轮廓)存在于所有模拟系统中;成分 3(,绿色轮廓)则在部分系统中出现。

方差计算中第二项的解析表达式

方程(8)为估计建立了通用表达式,这是表征基于 MLP 校准模型预测不确定性的基础。如前所述,模型估计带来的变异性(方程(8)的第一项)通过自助法估计,本节针对 MLP 模型的具体情况,给出了与方程(8)第二项相关的数学表达式,并推导了该表达式。

结论

本文提出并讨论了一种系统且直接的方法,用于估计基于 MLP 校准中的预测不确定性。该方法巧妙结合了德尔塔法和自助法这两种成熟的统计方法,为校准中应用最广泛的 ANN 模型之一 MLP 的 AFOMs 表征做出了重要贡献。MLP 的预测不确定性估计将有助于更全面地评估分析方法,推动分析化学领域的发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号