
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于GC-TOF/MS与GC-IMS数据融合的机器学习方法在浓香型白酒基酒质量分级中的应用研究
【字体: 大 中 小 】 时间:2025年07月01日 来源:Food Chemistry 8.5
编辑推荐:
针对传统白酒基酒质量分级依赖主观感官评价的问题,研究人员通过HS-SPME-GC-TOF/MS和HS-GC-IMS技术鉴定313种和188种风味化合物,结合随机森林(RF)与逻辑回归(LR)等机器学习算法,构建了准确率达91.3%的客观分级模型,为白酒行业智能化质量控制提供了新范式。
浓香型白酒作为中国白酒市场占比70%的主流香型,其基酒质量分级直接决定最终产品的品质。然而传统依赖人工感官评价的方法易受品酒师状态和环境干扰,缺乏客观标准。随着分析技术的发展,气相色谱-飞行时间质谱(HS-SPME-GC-TOF/MS)和顶空气相色谱-离子迁移谱(HS-GC-IMS)等仪器虽能全面解析酒体风味成分,但海量数据中存在大量与质量无关的冗余信息。如何从复杂风味图谱中提取关键质量标志物,建立科学分级模型,成为白酒智能制造领域亟待突破的难题。
来自宿迁市科技计划项目团队的研究人员选取五家酒厂的浓香型白酒基酒为研究对象,通过多组学数据融合与机器学习算法,成功构建了客观质量分级体系,相关成果发表于《Food Chemistry》。研究首先采用HS-SPME-GC-TOF/MS和HS-GC-IMS分别鉴定出313种和188种挥发性化合物,发现12种与质量等级显著相关的关键化合物(|ρ|>0.5),包括2-甲基丁酸乙酯(ethyl 2-methylbutanoate)、异戊酸乙酯(ethyl isopentanoate)等。随后将两组学数据融合,采用随机森林(RF)、逻辑回归(LR)等8种机器学习算法建模,其中RF模型表现最优,准确率达91.3%,F1分数0.9167,ROC曲线下面积(AUC)达0.98。
Sample preparation
研究选取四川五家酒厂的浓香型白酒基酒样本,按企业标准分为5个质量等级(1级最优),所有样本均经专业品酒团队感官验证。
CATA results for different quality grades of strong-flavor baijiu base liquor
通过检查所有接受测试(Check-All-That-Apply, CATA)结合9级Likert量表分析发现,高品质基酒呈现更突出的窖香、果香特征,而低等级酒体则更多显现刺激性气味。
Conclusion
该研究首次实现GC-TOF/MS与GC-IMS数据的有效融合,通过机器学习筛选出影响质量等级的关键风味标记物。RF模型在测试集保持89.5%的准确率,证实其稳定性和泛化能力。相较于传统方法,该体系将分级效率提升20倍,且不受人为因素干扰。
讨论部分指出,该方法学框架可扩展至其他香型白酒的质量控制,其中发现的12种关键化合物为行业标准制定提供了分子层面的科学依据。值得注意的是,研究同时揭示了不同品牌基酒的质量标志物存在差异,提示未来需建立品牌特异性模型。该成果不仅推动了白酒产业智能化进程,其"多组学+机器学习"的技术路线也为其他发酵食品质量评价提供了范式参考。
生物通微信公众号
知名企业招聘