
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于加权人工神经网络与卷积神经网络的枇杷汁图形特征图谱构建及分类研究
【字体: 大 中 小 】 时间:2025年06月09日 来源:Food Chemistry 8.5
编辑推荐:
本研究针对枇杷汁品种分类中人工特征选择主观性强、色谱数据转化效率低的问题,提出了一种整合HS-GC-IMS(顶空气相色谱-离子迁移谱)、分子特征描述符(MFD)与深度学习的新方法。通过w-ANNs(加权人工神经网络)构建图形特征图谱,结合CNN(卷积神经网络)实现枇杷汁(loquat_baisha/loquat_hongsha)的高效分类,并利用SHAP分析揭示关键MFDs(如Kappa2、LogP)。该研究为水果品质智能鉴定提供了自动化解决方案,发表于《Food Chemistry》。
枇杷作为中国东南部特色水果,其果汁产业面临品种鉴别效率低、风味物质解析依赖人工的瓶颈。传统HS-GC-IMS技术虽能检测挥发性有机物(VOC),但特征化合物筛选耗时且主观,图谱数据难以直接用于机器学习。为此,宁波某研究团队创新性地将化学分析与人工智能结合,开发了基于加权人工神经网络(w-ANNs)的图形特征图谱构建方法,并通过卷积神经网络(CNN)实现枇杷汁品种自动分类,相关成果发表于《Food Chemistry》。
研究采用HS-GC-IMS分析两种枇杷汁(loquat_baisha/loquat_hongsha)的VOCs,结合分子特征描述符(MFD)量化化合物特性,通过w-ANNs将标量数据转化为二维特征图谱。利用TensorFlow框架搭建CNN分类模型,并采用SHAP(SHapley Additive exPlanations)算法解析关键MFDs贡献度。此外,通过PubChem数据库扩充化合物结构库以增强数据维度。
样本制备
研究采集自浙江宁海的两种枇杷(loquat_baisha/loquat_hongsha),经冷冻保存后榨汁过滤,确保样本原始风味。
HS-GC-IMS表征
在三维和二维图谱中,通过保留指数(RI)和信号强度差异识别出14种关键VOCs(各品种7种),其中loquat_baisha以醛类为主,loquat_hongsha富含酯类化合物。
MFD与特征图谱构建
SHAP分析显示,loquat_baisha分类最重要的MFDs为Kappa2(分子拓扑描述符)、Gasteiger电荷和LogP(脂水分配系数),而loquat_hongsha则依赖Kappa2、Kappa3和Fraction_SP3(sp3
杂化碳比例)。w-ANNs将这些参数转化为灰度梯度特征图谱,实现化学数据的图像化编码。
CNN分类性能
模型对两种枇杷汁的分类准确率达92.7%,显著优于传统色谱分析法。GPU加速的矩阵运算使训练效率提升3倍。
结论与意义
该研究首次建立从HS-GC-IMS原始数据到深度学习分类的完整流程,突破了色谱数据图形化转换的技术瓶颈。通过MFD的量化评估和PubChem库的扩展,为小样本食品分析提供了新思路。成果不仅适用于枇杷产业链的品质控制,其方法论还可推广至其他果汁或风味产品的快速鉴别,推动食品化学迈向智能化时代。
生物通微信公众号
知名企业招聘