编辑推荐:
在近红外光谱(NIR)分析中,校准模型难以跨仪器应用。研究人员开展基于主成分极限学习机(PCELM - ELM)的校准转移和定量方法研究。结果显示该方法转移和定量能力出色。其意义在于避免重新校准,为 NIR 应用提供新方法。
在现代分析化学领域,近红外光谱(NIR)技术凭借其无损、快速且成本低的优势,广泛应用于多个行业,从化学科学到医学分析,从农业到食品科学,它就像一个 “多面手”,能对各种样品进行分析。然而,NIR 技术在实际应用中却遭遇了一个棘手的问题:不同仪器对同一样品的光谱响应存在差异。这就好比用不同的尺子去测量同一个物体,得到的结果却不一样。由于 NIR 光谱数据对环境十分敏感,在一台仪器上建立的校准模型,往往包含了与该仪器和环境相关的变化信息,直接将其应用到其他仪器上,就如同张冠李戴,会导致预测结果出现偏差。而且,开发和维护这些校准模型既耗时又需要专业知识,尤其是在分析复杂样品时,难度更大。
为了解决这一难题,来自未知研究机构的研究人员开展了一项极具创新性的研究。他们提出了一种基于主成分极限学习机(PCELM - ELM)的系统校准转移和定量方法,为 NIR 光谱技术的发展带来了新的曙光。该研究成果发表在《Analytica Chimica Acta》上,引起了广泛关注。
研究人员在开展此项研究时,主要运用了以下几种关键技术方法:首先是偏最小二乘法(PLS),通过建立 PLS 模型获取主成分光谱;其次是极限学习机(ELM),它是一种高效的学习算法,用于训练单隐藏层前馈网络,具有计算速度快、泛化性能好等优点。研究人员利用 ELM 建立校准模型,同时将 ELM 应用于自动编码器(ELM - AE),以寻找不同仪器光谱间的转换关系。此外,还使用了主成分分析(PCA)相关技术,将偏最小二乘主成分作为转移对象,实现从从属仪器光谱到主仪器主成分光谱的直接转移 。
下面来详细看看研究结果:
- 玉米数据集:研究人员对三种仪器上的玉米光谱进行分析,对比了多种方法对玉米中油、蛋白质、水和淀粉含量的预测效果。结果发现,PCELM - ELM 在预测油含量方面优势显著,无论使用多少样本构建转移模型,其预测的均方根误差(RMSEP)都最小。例如,当子集样本数为 10 时,PCELM - ELM 的 RMSEP 为 0.1060,明显小于其他方法。这表明基于 ELM 的量化模型在该任务上优于 PLS。
- 烟草数据集:在对两种仪器上的烟草光谱研究中,PCELM - ELM 预测值分布更集中在直线 y = x 周围。从 RMSEP 数据来看,当校准集大于 10 时,PCELM - ELM 总能获得最低的前两个 RMSEP 值,且结果小于基于 PLS 的 TEAM 方法,再次证明了引入主成分在 TEAM 校准转移中的有效性。
- 药物片剂数据集:对于两种仪器上的药物片剂光谱,PCELM - ELM 同样表现出色,总能获得最低的前两个 RMSEP 值,且结果小于基于 PLS 的 TEAM 和 PCELM 方法,这进一步说明基于 ELM 的量化方法在 PCELM 校准转移中比 PLS 更合适。
- 稳定性测试:由于 ELM 中隐藏节点和权重的随机初始化,研究人员多次重复建模和预测过程。结果显示,不同数据集上 PCELM - ELM 预测的 RMSEP 方差都较小,如玉米数据集上油含量预测的方差为 7.4239×10-7 ,充分证明了该方法的稳定性。
- 正则化影响:研究发现,随着正则化参数 C 的增加,PCELM - ELM 模型性能逐渐稳定,最终确定 50,000 作为正则化参数。
- 主成分的重要性:通过分析发现,使用主成分有助于 ELM 模型找到更准确的光谱转移关系,能显著降低仪器间系统差异的影响。在光谱变量 480 - 550 处,主成分权重和变量重要性投影(VIP)值有局部最大值,转移后该波段差异明显减小。
- ELM 定量模型的适用性:PCELM - ELM 在大多数情况下能实现最佳的转移和预测结果,表明 ELM 校准模型能准确捕捉光谱中的定量信息,其定量能力与 PLS 相当甚至更优。
综合来看,该研究提出的 PCELM - ELM 方法基于偏最小二乘法和转移极限学习机自动编码器方法(TEAM),在多个 NIR 数据集上展现出卓越的转移和定量能力。它能够稳定地校正不同仪器获得光谱间的系统差异,在多数情况下,仅需较少的校准集就能建立转移关系并获得最小的 RMSEP。这一方法避免了昂贵且耗时的重新校准过程,为近红外光谱技术在实际应用中的校准转移提供了一种准确、实用的新途径,是一种极具潜力的实时 NIR 校准转移方法,有望推动近红外光谱技术在更多领域的深入应用和发展。