基于拉曼光谱共享编码器特征进行奶粉掺假识别与定量分析

《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》:Milk powder adulteration identification and quantification based on shared encoder features using Raman spectroscopy

【字体: 时间:2025年11月19日 来源:Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy 4.3

编辑推荐:

  奶粉掺假快速检测方法研究:基于拉曼光谱的DD-SIMCA与MLP融合模型在低浓度多掺假场景下实现100%筛查准确率,MLP分类准确率达99%,浓度预测R2>0.99,优于传统SVM/RF/PLSR方法,为现场快速检测提供新途径。

  
向楚丽|毛园庞|叶华和|于恒王|建安徐|强谭|金毅李|伟业余|欣欣刘|宇丁|余宝孙
中国南京信息科学技术大学大数据分析技术江苏省重点实验室,南京 210044

摘要

在低浓度以及多种掺杂物混合的情况下,检测奶粉中的掺杂物具有挑战性。因此,精确检测对于确保奶粉的安全性和质量控制至关重要。本研究提出了一种基于拉曼光谱的方法,该方法结合了数据驱动的类比软独立建模(DD-SIMCA)和多层感知器(MLP)。首先,DD-SIMCA在无需事先了解掺杂物类型的情况下,对低浓度样品和多种掺杂物混合样品进行了非目标筛查,以区分真实样品和掺杂样品。接下来,对于被DD-SIMCA标记为掺杂的样品,应用了带有共享编码器的MLP。该编码器提取了用于掺杂物分类和浓度预测的特征,从而实现了准确的分类和精确的量化。实验表明,DD-SIMCA在掺杂物检测方面的准确率为100%;MLP在掺杂物分类方面的准确率为99%。在浓度预测方面,其R2P值为0.99,RMSE?低于0.6,优于传统的SVM、RF和PLSR等方法。这些结果证明了所提出的方法能够有效应对低浓度条件和多种掺杂物混合的情况,为奶粉掺杂筛查提供了实用的快速检测和现场应用途径。

引言

奶粉因其高营养价值、易于储存和运输而被广泛用于婴儿配方奶粉和成人营养补充剂中[1]。然而,由于其高市场 demand 和经济价值,它成为经济动机驱动的掺杂目标,尤其是通过添加低成本替代品进行掺杂。此类行为威胁消费者健康,并影响产品质量和安全[2]。因此,开发快速、准确、可靠的奶粉掺杂检测方法对于食品安全监管和质量控制非常重要。
现有的奶粉掺杂检测技术主要包括生物传感器[3]、液相色谱[4,5]和电感耦合等离子体质谱(ICP-MS)[6]。然而,这些方法通常需要复杂的样品预处理、昂贵的试剂和较长的分析时间,这限制了它们在大规模快速筛查中的应用。相比之下,拉曼光谱是一种分子振动光谱技术,可以直接揭示样品的化学成分和分子结构。它具有分析速度快、无损检测和样品制备简单的优点,并且能够实现复杂基质中的非目标掺杂物检测。因此,拉曼光谱在食品质量和安全监测中受到了越来越多的关注[2,7]。
为了对掺杂和真实的奶粉样品进行分类,分别应用了基于数据驱动的SIMCA(DD-SIMCA)和对抗性判别神经网络(ADNN)的一类分类模型。J. Mazivila等人[8]和Xia等人[9]分别使用了这两种方法,报告的检测准确率均超过99.9%。此外,Yang等人[10]和Zhang等人[11]分别基于PLS模型实现了对非蛋白氮掺杂物的快速分类和量化。对于非蛋白氮掺杂物,检测限降低到了0.1%;不同动物来源的奶粉分类准确率达到了93%,定量均方根误差(RMSE)低于0.2%。此外,Karacaglar等人[12]使用拉曼光谱与主成分分析(PCA)结合的方法来鉴定乳脂来源。在酸奶和奶油样品中,他们报告了100%的分类率,表明该策略可以扩展到不同乳制品基质的掺杂检测中。Wu等人[13]融合了拉曼光谱和近红外(NIR)光谱特征,并构建了MDS-CNN用于骆驼奶粉的掺杂检测,实现了最高的R2P值0.9915,展示了深度卷积神经网络在光谱掺杂分析中的特征提取优势。
然而,以往的研究主要集中在非目标掺杂筛查的一类分类或单一掺杂物分析上。在低浓度和多种掺杂物混合的情况下,关于分类和量化的研究相对较少。因此,需要一种有效的方法来实现在低浓度、多种掺杂物混合条件下的掺杂物分类和量化。
为此,提出了一种基于拉曼光谱的方法,结合了DD-SIMCA和多层感知器(MLP)。该方法仅使用未掺杂的奶粉样品进行训练,无需事先了解掺杂物类型即可实现非目标掺杂检测。随后,构建了一个带有共享编码器的MLP,以获取被标记为掺杂的样品的详细信息。共享编码器提取了用于掺杂物分类和浓度预测的特征,从而实现了掺杂物类型的最终分类及其浓度的定量确定。此外,共享编码器提取的特征(SEFs)被用作多个传统模型的输入进行比较评估。

样本制备

样品制备

本研究收集了40种不同品牌的市售奶粉产品作为真实样品。此外,向奶粉中添加了四种常见的掺杂物:小麦水解蛋白(WHP)、大豆分离蛋白(SPI)、玉米淀粉(CS)和滑石粉(Talc),以制备掺杂样品。总共准备了104个样品,包括40个真实样品和64个掺杂样品。
掺杂样品包括单一掺杂物和

拉曼光谱分析

原始拉曼光谱常常受到荧光背景、噪声干扰和基线漂移的影响,这些因素直接影响特征提取和建模的准确性。为了解决这些问题,依次应用了一系列预处理步骤:Savitzky–Golay(SG)平滑处理去除高频噪声[21]、自适应迭代加权惩罚最小二乘(airPLS)进行基线校正[22],以及标准正态变量(SNV)变换以标准化强度变化

结论

本研究提出了一种结合DD-SIMCA建模和MLP的奶粉掺杂检测策略,有效解决了低浓度和多种掺杂物混合条件下的分类和量化问题。首先,使用DD-SIMCA在无需事先了解掺杂物类型的情况下区分了真实样品和掺杂样品。随后,训练了带有共享编码器的MLP,以提取用于掺杂物分类和浓度预测的共享特征。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

致谢

本研究得到了国家自然科学基金(62105160、62203225)、福建省自然科学基金(2023J05303)、江苏省自然科学基金(BK20220443)、教育部地球物理勘探装备重点实验室(吉林大学,GEIOF 20240402)以及青兰项目的资助。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号