编辑推荐:
为解决初榨橄榄油(VOO)地理 authenticity 鉴别难题,研究人员结合近红外(NIR)、红外(IR)光谱与偏最小二乘判别分析(PLS-DA),对多国样品分类。发现品质等级不一致会影响模型,建议预处理质量评估,为 VOO 认证提供新方法。
橄榄油作为全球重要的健康油脂,其地理来源不仅关乎产品声誉,更涉及经济利益与消费者信任。然而,现有监管框架在追溯橄榄油地理 origin 时存在明显短板,传统依赖供应链文件核查的方式难以有效遏制产地造假。尤其不同产地橄榄油价格差异显著,如意大利特级初榨橄榄油(EVOO)价格比西班牙、希腊同类产品高 15-20%,低价产区进口量增加更催生了标签欺诈风险。如何快速、精准地鉴别橄榄油地理 origin,成为保障产业健康发展的关键科学问题。
在此背景下,意大利研究人员开展了一项针对初榨橄榄油(VOO)地理分类的创新研究,相关成果发表在《Food Chemistry: X》。该研究旨在探索非靶向红外光谱技术结合化学计量学方法在橄榄油产地鉴别中的应用潜力,同时评估样品化学品质特性(如过氧化物值、脂肪酸组成等)对分类模型的影响。
研究团队收集了来自意大利(普利亚、托斯卡纳)及摩洛哥、约旦、希腊、突尼斯、西班牙等国家的 97 份 VOO 样品,所有样品均为 2022-2023 年产且标注为特级初榨。研究采用的关键技术方法包括:①近红外(NIR)光谱分析,在 4000–12,500 cm-1波长范围采集透反射光谱,使用 Viscous Liquid Sampler(VLS)附件;②红外(IR)光谱分析,在 651–4000 cm-1范围采用衰减全反射(ATR)模式采集光谱;③化学计量学分析,通过主成分分析(PCA)探索数据结构,利用偏最小二乘判别分析(PLS-DA)构建分类模型,结合标准正态变量变换(SNV)、广义最小二乘加权(GLSW)等预处理方法优化模型性能;④常规化学分析,包括酸度、过氧化物值测定及脂肪酸组成、总酚含量(TPC)分析。
3.1 NIR 光谱与数据探索性分析
NIR 光谱显示,样品光谱在 10,000 cm-1以下区域包含主要信息,特征波段与脂肪酸和甘油三酯结构相关。PCA 分析表明,经 GLSW 预处理后,样品在主成分空间中呈现更清晰的聚类趋势,普利亚产区样品与托斯卡纳及外国样品沿 PC1 明显分离,暗示光谱差异与脂肪酸不饱和度等因素相关。
3.2 IR 光谱与数据探索性分析
IR 光谱经 SNV 预处理后,散射效应显著降低。PCA 结果与 NIR 类似,GLSW 预处理后意大利产区与外国样品在 PC1 和 PC2 方向上形成有效区分,但载荷图解析度较低,主要贡献波段与 NIR 结果一致,集中在反映脂肪酸结构的区域。
3.3 基于 PLS-DA 的地理 origin 非靶向分类
PLS-DA 模型在 NIR 和 IR 数据中均表现出高分类性能,经优化预处理后,灵敏度和特异度均高于 0.90。例如,NIR 数据结合 SNV+1D+GLSW 预处理,预测阶段灵敏度达 0.94–1.00,分类误差低至 0.03–0.16;IR 数据采用 SNV+GLSW 预处理,预测特异度达 0.80–1.00。变量重要性投影(VIP)分析显示,4500–6000 cm-1光谱区域是 NIR 分类的关键,与脂肪酸不饱和度密切相关,而 IR 光谱在 1800–2700 cm-1区域贡献较低。
3.4 品质参数对地理分类的影响
化学分析发现,不同产区样品过氧化物值存在显著差异(普利亚 9.42 vs 托斯卡纳 33.57 meq O2/kg),且过氧化物值与地理 class 存在非关联性交叉。PLS-DA 模型显示,仅用化学数据分类时过氧化物值为主要贡献因子,提示品质不一致可能干扰产地判别。剔除过氧化物值 > 20 meq O2/kg 的非特级样品后,光谱模型性能保持稳定,证实预处理质量评估的必要性。
研究表明,近红外和红外光谱结合化学计量学可有效实现初榨橄榄油的地理 origin 分类,PLS-DA 模型灵敏度和特异度均高于 0.90,展现出与气相色谱 - 质谱(GC-MS)等传统方法相当甚至更优的性能。然而,样品品质等级不一致(如氧化程度差异)可能导致分类偏差,过氧化物值等非产地相关因素会干扰模型准确性。因此,研究强调在应用非靶向光谱技术进行产地鉴别前,需通过预处理质量评估(如测定过氧化物值、脂肪酸组成)确保样品化学一致性,以提升模型可靠性。
该研究为橄榄油地理 authenticity 鉴别提供了快速、非破坏性的新方案,结合光谱技术的高通量优势与化学计量学的智能分析能力,有望应用于工业现场的实时检测。同时,研究首次系统揭示了品质特性对非靶向分类的潜在影响,为构建 “质量控制 - 产地鉴别” 一体化分析流程奠定了理论基础,对其他食品(如果汁、蜂蜜)的原产地溯源研究具有重要借鉴意义。未来需进一步扩大样本量、平衡 class 分布,以验证模型的普适性与稳健性。