高光谱成像结合机器学习和深度学习技术,用于无损检测辣椒(Capsicum annuum L.)粉剂中的掺假情况
《International Journal of Food Properties》:Hyperspectral imaging combined with machine and deep learning for non-destructive detection of defective red pepper (capsicum annuum L.) powder adulteration
【字体:
大
中
小
】
时间:2025年10月03日
来源:International Journal of Food Properties 3.9
编辑推荐:
非破坏性检测方法结合短波红外高光谱成像与机器学习/深度学习技术,有效识别含微生物污染的红辣椒粉末掺假,通过二维相关光谱降维(112波段→15关键波段),支持向量回归(RPD>9.81)和循环神经网络(R2>0.98)模型表现最佳,同时实现掺假比例可视化分布。
本研究旨在开发一种非破坏性方法,用于检测红辣椒粉中的掺假缺陷样品(Defective Red Pepper Powder, DRPP)。通过结合短波红外(Short-Wave Infrared, SWIR)高光谱成像(Hyperspectral Imaging, HSI)技术与先进的数据预处理、降维方法以及机器学习(Machine Learning, ML)和深度学习(Deep Learning, DL)算法,研究团队构建了一个高效、准确且可推广的检测系统。该方法不仅能够在不破坏样品的前提下实现快速检测,还能够通过光谱信息直观地呈现DRPP在红辣椒粉中的分布模式,为食品安全和农产品掺假评估提供了新的技术路径。
红辣椒作为一种广泛种植和消费的香料作物,尤其在亚洲和南美洲国家具有重要的经济和文化价值。然而,在其供应链中,由于红辣椒易受微生物污染影响,如霉菌、真菌等,导致其品质下降。这种劣化不仅影响产品的感官特性,还可能产生有毒代谢产物,如黄曲霉毒素,对消费者健康构成威胁。因此,建立一种快速、准确且非破坏性的检测手段对于保障食品安全至关重要。传统方法如高效液相色谱(HPLC)、毛细管电泳(CE)、气相色谱-质谱联用技术(GC-MS)、聚合酶链式反应(PCR)和微生物计数等虽然在实验室环境中具有较高的准确性,但往往需要复杂的样品前处理过程,耗费大量时间和人力,难以满足实际应用中对实时性和便携性的需求。
高光谱成像技术的出现为解决这一问题提供了新的思路。HSI不仅能够获取样品的光谱信息,还能保留其空间结构,使得在检测过程中可以同时分析化学成分和物理分布。特别是在短波红外波段(900–1700 nm),由于该波段能捕捉蛋白质、碳水化合物、脂肪和胺类分子的振动信息,因此在食品检测领域展现出独特的应用潜力。然而,HSI数据通常具有高维度和多变量相关性,这给后续建模带来了挑战。因此,本研究引入了多种预处理方法和降维技术,以提高模型的预测能力和计算效率。
在数据预处理方面,研究团队采用包括标准化(Standard Normal Variate, SNV)、Savitzky-Golay一阶导数(SG-1)、面积归一化(Area Normalization)、正交信号校正(Orthogonal Signal Correction, OSC)等方法。这些技术有助于去除噪声、校正背景干扰,并增强光谱特征的可辨识性。通过对比不同预处理方法对模型性能的影响,研究发现结合SNV和SG-1预处理的模型在预测能力上表现最佳,尤其是在支持向量回归(Support Vector Regression, SVR)模型中,其残差预测偏差(Residual Predictive Deviation, RPD)达到了9.81,远高于常规方法。这一结果表明,经过优化的预处理流程能够有效提升模型的鲁棒性和泛化能力。
在降维方面,研究采用二维相关光谱(Two-Dimensional Correlation Spectroscopy, 2D-COS)技术,将原始的112个波长数据缩减至15个具有代表性的波长。2D-COS通过将一维光谱数据扩展为二维矩阵,能够揭示光谱中因掺假引起的细微变化。这些波长主要集中在1139、1146、1153、1160、1223、1391、1398、1405、1413、1420、1427、1690、1697、1704和1711 nm,其中部分波长与碳水化合物中的O–H基团和糖类中的C–H和O–H伸缩振动有关。这些波长的变化反映了红辣椒粉在受到微生物污染后,其化学成分发生显著改变,如糖分、有机酸和辣椒素含量的变化,为后续建模提供了关键的输入信息。
为了进一步提高模型的预测性能,研究团队分别构建了多种机器学习和深度学习模型。其中包括偏最小二乘回归(Partial Least Squares Regression, PLSR)、支持向量回归(SVR)、弹性网络回归(Elastic Net Regression, ENR)以及人工神经网络(Artificial Neural Network, ANN)、一维卷积神经网络(1D-Convolutional Neural Network, 1D-CNN)和循环神经网络(Recurrent Neural Network, RNN)。这些模型在不同的预处理和降维条件下进行了训练和测试,结果显示,经过2D-COS降维后的模型在预测精度上不仅不逊色于全波长模型,反而在某些情况下表现出更优的性能。例如,SVR结合SNV和SG-1预处理的模型在RPD指标上达到了9.81,而RNN模型在归一化和SG-1预处理后,其预测相关系数(R2)和RPD均超过了0.98和7.85,说明这些模型在处理降维后的光谱数据时,依然能够保持较高的准确性。
此外,研究还利用主成分分析(Principal Component Analysis, PCA)对降维后的光谱数据进行了可视化分析。PCA能够将高维光谱数据转化为几个主要成分,从而揭示样本之间的差异性。通过PCA得分图,研究团队能够直观地看到DRPP掺假比例的变化如何影响红辣椒粉的光谱特征。例如,随着DRPP掺假比例的增加,样本在PCA图中的分布逐渐从原本的红色区域向蓝色区域移动,这表明DRPP的引入对红辣椒粉的化学成分产生了显著影响。同时,PCA还帮助识别了不同样品之间的关键化学差异,如自由糖和辣椒素含量的变化,这些特征可以作为区分正常红辣椒粉(Normal Red Pepper Powder, NRPP)和DRPP的重要依据。
研究团队还通过可视化地图(Distribution Mapping)展示了DRPP在红辣椒粉中的分布情况。利用SWIR光谱信息,结合PCA和RGB图像,研究团队能够以颜色变化的方式反映DRPP的含量比例。例如,在DRPP含量较高的样品中,地图的颜色逐渐从蓝色变为红色,表明DRPP的分布范围扩大。这种可视化方法不仅有助于直观判断样品的掺假程度,还能为后续的模型优化提供方向。此外,该方法适用于不同来源的红辣椒粉,包括中国和韩国的产品,说明其在不同地理背景下的通用性和适应性。
在模型构建过程中,研究团队特别关注了不同预处理方法对模型性能的影响。结果显示,SNV和SG-1预处理对SVR模型的预测能力有显著提升,而面积归一化对PLS和ENR模型的性能也有积极影响。然而,某些预处理方法如平滑(Smoothing)虽然有助于降低噪声,但可能在一定程度上掩盖了关键的光谱特征,从而影响模型的准确性。因此,选择合适的预处理策略对于提高模型的预测能力至关重要。
深度学习模型,特别是RNN,在本研究中表现出卓越的性能。RNN能够有效处理具有时间序列特性的数据,如高光谱图像中的像素序列,使其在识别DRPP掺假时具有更强的适应性和准确性。通过结合归一化和SG-1预处理,RNN模型在预测相关系数和RPD指标上均优于其他模型,显示出其在处理高维数据方面的优势。相比之下,ANN和1D-CNN模型虽然也受益于降维,但在整体预测能力上略逊一筹,这可能与它们对噪声和变量序列长度的敏感性有关。
通过对比不同模型的预测结果,研究团队发现,基于2D-COS降维后的模型在预测精度上表现更优,同时减少了计算负担。这表明,合理的特征选择策略能够显著提升模型的效率和性能。此外,研究还指出,尽管某些模型在训练过程中表现出较高的预测能力,但需要进一步的外部验证以确保其在实际应用中的稳定性和可靠性。
本研究的成果不仅为红辣椒粉掺假检测提供了新的技术手段,还展示了HSI技术在食品质量监控中的广泛应用前景。通过结合先进的预处理、降维和建模方法,研究团队构建了一个非破坏性的检测框架,能够快速、准确地识别DRPP的掺假比例。该方法不仅适用于红辣椒粉,还可推广至其他食品和农产品的检测领域,为食品安全和质量控制提供了强有力的技术支持。此外,该方法的可扩展性使其能够应用于实时、在线的质量监控系统,为食品行业提供了更加便捷和高效的检测方案。未来的研究可以进一步优化模型参数,探索更多预处理方法,并结合便携式HSI设备和自动化决策系统,以提高该技术的实用性和普及率。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号