基于机器学习的GC-IMS特征图谱构建新方法及其在桃汁加工分类中的应用

【字体: 时间:2025年06月29日 来源:Food Control 5.6

编辑推荐:

  本研究针对GC-IMS(气相色谱-离子迁移谱)数据手动分析效率低、特征提取不足的问题,提出了一种结合行加权损失函数(RWLF)与样本重加权梯度下降(SRGD)的机器学习框架,通过加权人工神经网络(w-ANNs)和卷积神经网络(CNN)将标量矩阵转化为图形化特征图谱。该方法在桃汁品种(准确率0.93)和加工阶段(准确率0.96)分类中表现优异,为水果加工自动化提供了新范式。

  

研究背景与意义
白桃(Prunus persica)作为典型的呼吸跃变型水果,采后损失率高且加工质量控制依赖复杂分析技术。传统GC-IMS虽能生成化合物二维/三维浓度图谱,但特征提取依赖人工经验,制约了水果汁液分类与生产的自动化进程。如何将GC-IMS的标量数据转化为机器可识别的图形化特征,成为突破技术瓶颈的关键。

研究方法与技术路线
北京中电华源环保技术有限公司资助的研究团队开发了RWLF-SRGD(行加权损失函数-样本重加权梯度下降)算法,嵌入加权人工神经网络(w-ANNs)和SHAP(Shapley Additive Explanations)加权系统,结合CNN进行特征增强。实验采用浙江奉化、阳山产蜜桃及慈溪杨梅为样本,通过GC-IMS获取化合物浓度矩阵,经标量-向量转换生成图形特征图谱。

核心研究结果

  1. 样本准备:分析奉化(FH)、阳山(YS)两地蜜桃及不同加工阶段的桃汁,建立包含地理来源与加工步骤的三组样本队列。
  2. 权重算法评估:对比显示w-ANNs较非加权网络(nw-ANNs)损失值降低37%,特征区分度提升2.1倍(图2A-1/2A-2)。
  3. 图形特征图谱生成:通过RWLF-SRGD优化后的标量矩阵,经CNN提取的分子化学描述符(MCDs)可可视化呈现不同产地桃汁的挥发性有机物(VOCs)差异。

结论与讨论
该研究首次实现GC-IMS数据向图形特征图谱的自动化转换,其RWLF-SRGD-wANNs框架在桃汁地理标志识别(准确率0.93)和加工阶段判别(准确率0.96)中展现出显著优势。该方法突破了传统色谱分析依赖人工标记的局限,为水果加工质量控制的GPU(图形处理器)加速处理提供了新思路。研究结果发表于《Food Control》,为农产品深加工的智能检测树立了新标杆。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号