
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于CNN-LSTM混合深度学习模型的SW-NIR光谱技术预测Java Plum糖含量研究
【字体: 大 中 小 】 时间:2025年09月08日 来源:Measurement: Food 3.6
编辑推荐:
研究人员针对传统水果糖分检测方法耗时费力的问题,创新性地采用短波近红外(SW-NIR)光谱技术结合卷积神经网络-长短期记忆(CNN-LSTM)混合模型,实现了Java Plum糖含量的快速无损检测。研究通过Savitsky-Golay二阶导数预处理优化光谱数据,构建17层深度神经网络,最终模型预测相关系数Rpred达0.83,显著优于传统偏最小二乘回归(PLSR)的0.554。该成果为水果品质智能化检测提供了新方法,发表于《Measurement: Food》。
在热带水果品质评估领域,Java Plum(Syzygium cumini L.)因其独特风味和药用价值备受关注,但其糖分检测长期依赖耗时的人工化学分析方法。传统技术如折光仪测定和色谱分析不仅破坏样本,还难以满足现代农业生产中对大批量水果快速分级的需求。这促使科学家将目光投向短波近红外(SW-NIR)光谱技术——一种通过分子振动特征实现无损检测的先进手段。然而,现有研究多采用线性建模方法如偏最小二乘回归(PLSR),对复杂光谱中非线性特征的解析能力有限,特别是在Java Plum这种尚未建立光谱数据库的新型水果上。
为突破这些技术瓶颈,来自孟加拉农业大学的M. Mirazus Salehin团队在《Measurement: Food》发表了一项创新研究。他们巧妙地将深度学习中的卷积神经网络(CNN)与长短期记忆网络(LSTM)相结合,开发出能同时捕捉光谱空间特征和时间序列依赖性的混合模型。研究团队从当地市场采集220个Java Plum样本,使用900-1700nm波段的SW-NIR光谱仪获取反射率数据,并同步用折光仪测定可溶性固形物含量(SSC)作为基准值。
关键技术方法包括:1) 采用Savitsky-Golay二阶导数等预处理技术优化光谱;2) 构建包含1D-CNN、LSTM和GroupNormalization层的17层混合网络;3) 使用Adam优化器(学习率0.0004)训练模型;4) 通过Kennard-Stone算法划分70%校准集和30%预测集。所有实验均在Nvidia RTX 3060显卡的TensorFlow-GPU平台上完成。
光谱特征与样本统计
研究首先解析了Java Plum的特征吸收峰:1450nm处的强峰对应O-H键伸缩振动,960nm处的峰与C-H键相关,而1700nm和1280nm的峰分别反映甲基和羟基特征。样本SSC值分布在8.9-18.3 %Brix之间,平均13.5%Brix,校准集与预测集具有可比性分布。
PLSR模型优化
比较多种预处理方法后发现,Savitsky-Golay二阶导数处理的光谱数据在PLSR模型中表现最佳,预测相关系数Rpred=0.554,预测标准误差(SEP)为1.497%Brix。虽然该结果尚未达到理想定量分析标准(RPD>2),但为后续深度学习提供了基准。
CNN-LSTM模型突破
提出的混合模型展现出显著优势:三组CNN-LSTM模块通过16通道的1D卷积核(尺寸4×1至8×1)提取局部特征,配合32-128单元的LSTM层捕捉长程依赖。模型最终Rpred达0.83,较PLSR提升66.7%,平均绝对误差(MAE)仅1.27。ANOVA分析证实两模型差异显著(F值79.872>临界值3.957)。
横向比较
与SpectraNet-32(Rpred=0.74)和DeepSpectra(Rpred=0.51)等先进架构相比,CNN-LSTM性能提升10.51%-35.55%,其优势在于CNN处理光谱空间特征与LSTM记忆时序变化的协同效应。虽然集成神经网络略优(0.84),但CNN-LSTM在硬件成本和训练效率上更具实用性。
这项研究首次证实SW-NIR光谱结合CNN-LSTM模型在Java Plum糖分检测中的可行性,为开发在线分选系统奠定基础。未来研究可结合梯度可视化技术明确关键波长,并扩展至不同品种测试。该成果不仅为热带水果品质控制提供新范式,其"CNN特征提取+LSTM序列建模"的框架也可推广至其他农产品无损检测领域。
生物通微信公众号
知名企业招聘