利用傅里叶变换红外光谱(FTIR)结合模式识别技术检测速溶咖啡的掺假行为

《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》:Detection of ground coffee adulteration using FTIR coupled with pattern recognition techniques

【字体: 时间:2025年10月28日 来源:Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy 4.3

编辑推荐:

  咖啡掺假检测中FTIR结合监督与半监督学习的综合评估。采用随机森林、K-NN、决策树和主成分分析、层次聚类(HCA)等方法,预处理后HCA准确率达96.8%,显著优于监督模型。关键光谱区域包括脂质酯键(1740 cm?1)、酰胺I带(1650 cm?1)和碳水化合物特征区(1000-1100 cm?1)。

  在当今食品工业中,咖啡作为一种广受欢迎的饮品,其市场价值和消费量使其成为经济动机掺假行为的主要目标之一。由于咖啡在加工和储存过程中容易受到各种非咖啡成分的污染,因此需要高效且可靠的分析技术来确保其真实性。本研究采用了一种基于傅里叶变换红外光谱(FTIR)和模式识别技术的综合方法,以检测和分类咖啡中掺入的三种常见植物性粉末——大麦、鹰嘴豆和枣仁。该方法不仅能够有效识别掺假行为,还能在不依赖标签数据的情况下实现快速检测,为食品质量控制提供了一种实用的解决方案。

研究采用了多种预处理技术,包括标准化缩放、标准正态变量(SNV)校正、中值滤波、小波变换、Savitzky-Golay导数和乘法散射校正(MSC),以提高FTIR光谱的清晰度和模型的准确性。通过这些预处理步骤,研究者能够更有效地提取关键的光谱特征,并增强模型对不同掺假水平的识别能力。结果表明,适当的预处理可以显著提升模型的分类性能,特别是在检测低浓度掺假(如10%)时,增强了光谱对比度和特征区分度。

在监督学习方面,研究比较了三种主流的分类算法:随机森林(Random Forest)、K-近邻(KNN)和决策树(Decision Tree)。其中,随机森林在训练阶段表现出最高的整体准确率(94%),而在测试阶段也达到了83%的准确率,显示出良好的泛化能力和对复杂光谱模式的处理能力。相比之下,KNN在测试阶段的准确率(91%)和ROC-AUC值(0.92)均优于随机森林,特别是在识别纯咖啡和枣仁掺假样本时表现更为突出。然而,决策树的性能相对较弱,仅在测试阶段达到了70%的准确率,表明其在处理多变量光谱数据时存在局限性。

在非监督学习方面,研究采用了主成分分析(PCA)和层次聚类分析(HCA)两种方法。PCA主要用于降维和可视化,能够将高维FTIR数据投影到低维空间,保留大部分方差,从而揭示数据中的潜在结构。而HCA则直接基于光谱相似性对样本进行分类,无需依赖标签信息,显示出卓越的分类能力。结果显示,HCA在所有评估指标中表现最佳,达到了96.8%的总体准确率,并在纯咖啡、枣仁和鹰嘴豆样本的分类中实现了100%的准确率。这一结果突显了HCA在快速筛查掺假样品方面的优势,尤其是在缺乏标签数据的情况下。

为了进一步验证这些模型的性能,研究还通过混淆矩阵计算了准确率、精确率、召回率和F1分数等指标。结果显示,监督学习模型在识别纯咖啡和不同掺假类型时表现良好,而HCA在分类准确性和可解释性方面具有显著优势。此外,研究还通过Coomans图对随机森林模型的分类能力进行了直观评估,发现纯咖啡样本与掺假样本之间具有明显的分离,这进一步支持了HCA在食品掺假检测中的应用潜力。

研究还讨论了不同掺假类型对光谱特征的影响。例如,大麦掺假样品在1650 cm?1(酰胺I带)区域显示出较高的蛋白质含量,而枣仁掺假样品在1000–1100 cm?1(碳水化合物相关振动)区域表现出更明显的光谱特征。这些差异为光谱识别提供了重要的依据,表明FTIR技术能够有效检测不同类型的掺假行为。同时,研究指出,鹰嘴豆掺假是最具挑战性的,因为其光谱特征与咖啡存在较高的重叠,导致所有模型在识别时表现出较低的精确率和召回率。

本研究的一个重要贡献在于其系统性地比较了监督和非监督学习方法在咖啡掺假检测中的应用效果。通过整合多种模型和预处理技术,研究不仅验证了HCA在非监督学习中的优越性,还强调了监督学习方法在特定场景下的适用性。例如,随机森林在处理复杂数据时表现出更高的鲁棒性和可靠性,而KNN在外部验证中展现出更强的泛化能力。这种多方法的比较为食品掺假检测提供了更全面的视角,并为未来研究指明了方向。

此外,研究还讨论了当前方法在实际应用中的局限性。尽管研究中使用的数据集经过精心设计,涵盖了多种常见掺假类型和浓度,但样本量相对较小,这可能限制了模型的泛化能力。因此,未来的研究需要扩展数据集,包括更多种类的掺假物质和实际市场中的样本,以进一步提高模型的可靠性和适用性。同时,研究还提到,工业应用中可能面临多种挑战,如不同品牌和产地的咖啡产品之间的差异、现场光谱采集中的环境噪声影响,以及多掺假混合物的复杂性。这些问题需要通过更广泛的数据收集、更先进的预处理技术和更复杂的建模方法来解决。

总的来说,本研究为咖啡掺假检测提供了一种高效、非破坏性和无标签的解决方案。通过FTIR光谱与模式识别技术的结合,研究不仅揭示了咖啡与掺假物质之间的化学差异,还验证了不同模型在实际应用中的性能。这些成果为食品行业提供了重要的技术支持,有助于提升咖啡产品的质量和安全性,减少因掺假导致的经济损失和健康风险。未来的研究可以进一步优化模型,提高其在实际应用中的稳定性和准确性,以满足更广泛的需求。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号