
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于MCUVE-PLS-DA结合中红外光谱的巴西陈年卡莎萨酒鉴别新策略
【字体: 大 中 小 】 时间:2025年06月12日 来源:Food Control 5.6
编辑推荐:
本研究针对传统MCUVE方法在变量选择中过度依赖RMSECV的问题,提出了一种结合回归系数稳定性和分类错误率的双标准策略,用于PLS-DA模型优化。通过中红外光谱(MIR)分析仅需10 μL样本的无预处理技术,成功区分了amburana、橡木和freijó桶陈酿的卡莎萨酒,模型预测准确率达97.8%。该方法在保持高分类精度的同时显著提升变量筛选效率,为食品光谱分析提供了环保且可靠的解决方案。
卡莎萨酒作为巴西特有的甘蔗蒸馏酒,其陈酿过程与威士忌、干邑等烈酒类似,木桶中的酚类化合物迁移会显著改变风味特征。然而,传统鉴别方法依赖复杂前处理或色谱技术(如GC-MS、HPLC),存在成本高、耗时长等问题。中红外光谱(MIR)虽具快速检测潜力,但光谱变量冗余和噪声干扰限制了其应用。如何通过智能算法实现高效变量筛选,成为提升光谱分类性能的关键挑战。
针对这一难题,巴西的研究团队在《Food Control》发表研究,提出改进的蒙特卡洛无信息变量消除法(MCUVE),将其与偏最小二乘判别分析(PLS-DA)结合,开发出双标准变量选择策略。该方法创新性地将回归系数稳定性与分类错误率同步优化,突破了传统MCUVE仅依赖交叉验证均方根误差(RMSECV)的局限。研究采用135份来自巴西帕拉伊巴州不同产区的卡莎萨样本,直接采集10 μL样品的MIR光谱,无需任何前处理。通过比较Savitzky-Golay一阶导数、多元散射校正(MSC)等预处理方法,最终构建的模型对三种木桶陈酿酒鉴别准确率高达97.8%,显著优于传统MCUVE和变量重要性投影(VIP)方法。
关键技术包括:1)基于Kennard-Stone算法(KS)划分训练/测试集;2)采用蒙特卡洛采样评估变量重要性;3)结合PLS-DA构建分类模型;4)通过Hierarchical Clustering Analysis(HCA)验证光谱特征差异。
研究结果
INTRODUCTION
阐明卡莎萨陈酿过程中木桶来源的酚类化合物是风味差异的核心因素,但现有检测技术难以满足快速鉴别需求。
Samples
135份样本涵盖amburana、橡木和freijó三种木桶陈酿一年的卡莎萨,地理来源覆盖Brejo Paraibano等巴西主要产区,确保数据代表性。
Exploratory analysis
原始MIR光谱显示3000 nm和6100 nm处的羟基振动峰为关键特征,4650 nm弱峰可能与氰酸铜络合物相关,不同木桶样本在特定波段存在差异。
CONCLUSIONS
改进的MCUVE-PLS-DA将原始变量从6201个缩减至最优的42个,Savitzky-Golay一阶导数预处理显著提升信噪比,模型灵敏度达96.3%-100%。相比传统方法,新策略变量筛选效率提升40%,且避免过拟合。
重要意义
该研究首次将变量稳定性与分类性能双重标准引入MCUVE算法,为食品真实性鉴别提供新范式。仅需微量样本和无预处理的特点,使其特别适合工业化快速检测。作者Paulo Henrique Gon?alves Dias Diniz团队指出,该方法可扩展至其他烈酒或农产品溯源领域,其开源代码(未在文中明确提及但暗示可推广性)有望推动光谱分析技术的标准化进程。研究得到巴西国家科技发展委员会(CNPq)等机构资助,体现了发展中国家在食品分析技术创新中的重要贡献。
生物通微信公众号
知名企业招聘