
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于高光谱成像与可解释深度学习的山楂品种鉴别及品质成分定量预测研究
【字体: 大 中 小 】 时间:2025年09月22日 来源:Future Foods 8.2
编辑推荐:
本研究针对山楂品种鉴别和品质成分预测的难题,创新性地将高光谱成像(HSI)技术与可解释深度学习相结合,开发了一种快速无损的分析方法。研究团队采集了来自5个省份11个品种的1227份山楂样本,通过多方位光谱融合和EfficientNet模型构建,实现了高达95.92%的品种分类准确率,并对柠檬酸(R2=0.94)、总糖(R2=0.92)和维生素C含量进行了精准预测。结合Grad-CAM和SHAP的可视化解释,有效破解了深度学习"黑箱"问题,为中药材品质智能检测提供了新范式。
山楂(Crataegus pinnatifida)作为药食同源的重要果实,富含有机酸、糖类、维生素C和黄酮类等生物活性成分,具有抗氧化、抗炎和降血糖等多种生理功能。中国作为世界最大的山楂生产国,栽培面积达8.67万公顷,年产量超过150万吨。然而,由于遗传因素和环境条件的差异,不同品种和产地的山楂化学成分存在显著差异,关键品质指标如糖酸比和维生素C含量直接影响果实风味、营养价值和加工适用性。
传统鉴定方法依赖主观评价或理化分析技术,如高效液相色谱(HPLC)、液相色谱-质谱联用(LC-MS)、气相色谱-质谱联用(GC-MS)和DNA条形码技术等。虽然准确度高,但这些方法需要复杂的样品前处理、专业操作,且具有破坏性、耗时费力、成本高昂,难以满足食品质量大规模实时监测的需求。近红外(NIR)光谱技术虽提供了快速无损的替代方案,但仍需破坏性预处理(如干燥、研磨)且仅能收集单点光谱,限制了效率和综合评价能力。
高光谱成像(HSI)作为一种新兴的无损检测技术,能够同时提供丰富的光谱信息和高精度的图像特征。然而,传统高光谱分析通常需要选择特征波长来降维,但所选波长通常因数据集、算法和采集条件而异,导致显著的不一致性和模型依赖性。深度学习模型具有强大的自学习和泛化能力,特别适合处理高维复杂数据,但往往如同"黑箱",缺乏可解释性,影响对其决策的信任。
为此,中国中医科学院的研究团队在《Future Foods》发表了创新性研究成果,开发了一种结合高光谱成像与可解释深度学习的方法,用于山楂品种分类和品质预测。研究收集了来自河北、河南、山东、山西和辽宁5个省份11个品种的1227个新鲜山楂样本,采用高光谱成像系统(HySpex VNIR-1800和SWIR-384)在410-990nm(VNIR)和940-2500nm(SWIR)范围内采集数据。为确保模型鲁棒性,研究人员创新性地从三个不同方向(果柄水平、向上和向下)采集每个样本的HSI数据。
研究采用固定阈值分割方法自动提取感兴趣区域(ROI),通过主成分分析(PCA)降维后使用经验确定的阈值进行二值化处理,并结合形态学操作提高分割精度。化学成分分析方面,随机选取每个品种50个样本(Yanranhong品种为41个),通过冷冻干燥和研磨处理后,采用商业分析试剂盒测定总糖含量,使用超高效液相色谱-四极杆线性离子阱串联质谱(UPLC-Q/TRAP-MS/MS)测定柠檬酸和维生素C含量。
深度学习模型方面,研究比较了不同深度的CNN架构,发现增加卷积层数虽提高模型复杂度但性能提升有限。引入挤压激励(SE)注意力机制后,三层CNN在降低复杂度的同时将测试准确率提高了3.95%。EfficientNet模型基于EfficientNet-B0架构,包含7个MBConv模块,采用深度可分离卷积提高参数效率,并集成SE注意力模块自适应重新校准通道特征。
2.6. 模型可解释性
采用Grad-CAM和SHAP两种可解释人工智能(XAI)技术提升模型透明度。Grad-CAM生成类判别定位图,突出显示对模型输出贡献最大的输入区域;SHAP基于合作博弈论为每个特征分配附加重要性值,定量解释模型预测。
2.7. 数据集划分
分类任务中采用合成少数过采样技术(SMOTE)和分层采样解决类别不平衡问题,按7:2:1比例划分校准集、验证集和预测集;回归任务采用相同比例随机划分,不使用数据增强技术。
3.1. 光谱分析
通过Z-score统计方法识别并移除2个异常光谱后,分析显示不同方位的整体光谱趋势一致,但反射值存在显著差异。特征光谱峰位于约620、970、1120、1310、1640、1800和2200nm附近,谷值出现在670、840、970、1200、1480和1930nm附近。这些特征峰与山楂中色素、 carotenoids、chlorophylls、C-H和O-H伸缩振动等化学基团密切相关。
3.2. 柠檬酸、维生素C和总糖含量测定
Kruskal-Wallis H检验显示不同山楂品种间三种成分含量存在显著差异(p<0.05)。山西产"大五棱"(SX_DWL)柠檬酸含量最高(96.92mg/g),而山西"水果山楂"(SX_SG)和山东"金如意"(SD_JRY)含量较低。河北"铁山楂"(HB_TSZ)和山东"金如意"总糖含量最高,辽宁"本溪4号"(LN_BX)含量最低。维生素C含量以河北"铁山楂"、辽宁"本溪4号"和"辽红"(LN_LH)最高,山西"大五棱"最低。
3.3. 不同产地山楂品种分类结果
3.3.1. 网络深度和注意力对CNN性能的影响
比较不同深度CNN发现,增加卷积层数显著提高模型复杂度但准确率仅提高0.82%。引入SE注意力机制后,三层CNN在降低复杂度的同时提高了测试准确率。
3.3.2. 果实方向和模型类型对分类性能的影响
EfficientNet模型在不同方向上均优于CNN和CNN-SE模型。三个方向融合光谱数据的分类准确率显著高于单方向数据,达到95.92%。单方向中,位置1(果柄水平)准确率最低,位置2(果柄向下)和位置3(果柄向上)性能更好。
3.3.3. ROC曲线分析
EfficientNet模型在所有位置上均表现出更高的AUC值,使用三方向融合数据时所有模型AUC均超过0.98,显示出色的判别能力。
3.3.4. 混淆矩阵分析
EfficientNet模型在11个类别上保持高准确率,错误分类主要发生在样本量较少和光谱特征高度相似的品种中。
3.4. 柠檬酸、维生素C和总糖含量的回归结果
3.4.1. 回归结果
EfficientNet模型在三种成分预测中均表现最佳:柠檬酸(R2p=0.94,RPD=4.08)、总糖(R2p=0.92,RPD=3.55)和维生素C(Rp=0.86,RPD=1.93)。传统PLSR模型性能有限,CNN和CNN-SE对维生素C和总糖的预测改进不显著。
3.4.2. 预测结果可视化
散点图显示EfficientNet回归拟合结果具有良好的线性趋势,柠檬酸和总糖的数据点密集分布在45°对角线附近。
3.5. 模型可解释性分析
3.5.1. 柠檬酸模型可解释性分析
Grad-CAM显示模型在550-750、1350-1450、1850-1950和2100-2300nm区域响应增强。SHAP确定681、654、1625、703、1385、1712、2093和2480nm为最具影响力波长,这些与羧基官能团的倍频和组合带吸收一致。
3.5.2. 总糖模型可解释性分析
模型重点关注550-700、1130、1380-1420和1850-1920nm区域。SHAP突出显示649、670、1472、1734、1308、2208、1701和1499nm波段,这些与羟基官能团的谐波吸收相匹配。
3.5.3. 维生素C模型可解释性分析
Grad-CAM在600-700、1360-1450和1850-1900nm区域显示强响应。SHAP确定1505、1194、976、1946和960nm为关键波长,对应酚羟基和醇羟基的特征吸收带。
研究结论表明,该方法成功实现了山楂品种的高精度分类和关键品质成分的准确预测,多方向光谱融合显著提升了模型性能。EfficientNet架构在回归任务中表现出色,而Grad-CAM和SHAP技术的结合有效增强了模型的可解释性,揭示了光谱特征与化学成分之间的内在联系。这项研究不仅为山楂质量评估提供了快速、准确、可解释的解决方案,也为其他中药材和农产品的智能检测提供了重要参考。未来研究将扩展数据集涵盖更多品种、成熟阶段和环境条件,进一步提升模型的鲁棒性和泛化能力。
生物通微信公众号
知名企业招聘