将EEM荧光光谱技术与机器学习和深度学习模型相结合,以实现鱼类新鲜度的多输出预测
《Applied Food Research》:Integrating EEM fluorescence spectroscopy with machine and deep learning models for multi-output prediction of fish freshness
【字体:
大
中
小
】
时间:2025年09月23日
来源:Applied Food Research 6.2
编辑推荐:
EEM荧光光谱结合多任务机器学习模型实现鱼类实时新鲜度监测与分类,通过PCA和PARAFAC算法提取特征,SVR和随机森林预测TVB-N、K值等指标,CNN模型分类准确率达93.84%(大眼鲢)和90.47%(虹鳟鱼),并验证了跨物种迁移学习的有效性。
随着全球人口的不断增长和对水产品需求的持续上升,水产品的保鲜技术成为了食品供应链中的关键环节。水产品因其易腐特性,对储存条件有着高度依赖性。传统的保鲜检测方法通常复杂、耗时且具有破坏性,这不仅增加了成本,还限制了其在实际应用中的推广。因此,开发一种高效、准确且非破坏性的保鲜评估方法变得尤为重要。本研究提出了一种创新的多输出保鲜监测模型,结合了激发-发射矩阵(EEM)荧光光谱技术和两种机器学习(ML)方法与一种深度学习(DL)方法,以实现对水产品保鲜指数的预测和保鲜阶段的分类。
EEM荧光光谱技术因其高灵敏度、快速性和非侵入性而受到越来越多的关注。这种技术能够提供复杂样品中荧光化合物的全面指纹,从而实现定性和半定量分析。然而,原始的EEM数据通常具有高维特征,容易受到瑞利散射和拉曼散射等干扰,因此需要进行预处理和特征提取。本研究采用了一种名为PARAFAC的多变量分析方法,对EEM数据进行降维,同时比较了PCA和PARAFAC方法在不同ML算法中的表现。通过实验发现,PCA-RF模型在预测大头鱼和彩虹鳟的TVB-N、K值和TVC保鲜指数方面表现出色,其R2值达到0.85-0.98,RMSE值为0.23-3.63,显著优于PARAFAC-SVR/RF和PCA-SVR模型。
在保鲜阶段的分类方面,本研究设计了一种定制的卷积神经网络(CNN)模型,用于对大头鱼和彩虹鳟的保鲜状态进行分类。该模型在测试集上的准确率达到93.84%(大头鱼)和90.47%(彩虹鳟),表明其在实际应用中具有较高的可靠性。此外,研究还验证了模型的泛化能力,通过迁移学习的方法,调整特定鱼类的CNN模型,使其能够准确分类其他鱼类的保鲜状态,准确率超过了88.40%。这种基于迁移学习的方法不仅减少了模型训练所需的数据量,还降低了对大规模数据集的依赖,提高了模型的适应性和实用性。
在模型的构建过程中,研究人员对EEM数据进行了多种预处理方法,包括数据校正和数据增强。数据校正主要通过插值方法消除瑞利和拉曼散射对三阶数据阵列的影响,确保模型输入数据的准确性。数据增强则通过样本插值和噪声注入两种方式扩展训练集,提高模型的鲁棒性和泛化能力。这些预处理步骤为后续的机器学习和深度学习模型提供了高质量的数据基础,确保了模型训练的有效性。
深度学习模型,尤其是CNN,因其强大的特征提取能力,被广泛应用于图像识别和分类任务。在本研究中,CNN被设计用于处理EEM荧光光谱数据,通过卷积和池化操作自动学习和提取关键特征。CNN模型的结构包括两个卷积层、两个最大池化层、三个全连接层和一个Softmax层,以实现对保鲜状态的分类。模型的训练和优化采用交叉熵损失函数和Adam优化器,确保了模型在训练过程中的稳定性和高效性。此外,研究还对几种常见的图像处理模型,如AlexNet、LeNet和ResNet,进行了适应性修改,以便更好地处理EEM数据,提高分类性能。
在实际应用中,模型的性能通过多种评估指标进行验证,包括R2、RMSE、分类准确率(CCR)和F1分数。R2和RMSE用于评估回归模型的预测能力,而CCR和F1分数则用于评估分类模型的性能。研究结果表明,PCA-RF模型在预测保鲜指数方面表现最佳,其R2值和RMSE值均优于其他模型。对于分类任务,EEM-CNN模型在测试集上的准确率显著高于其他DL模型,进一步证明了其在保鲜分类中的有效性。
此外,研究还探讨了EEM-CNN模型的可解释性,通过集成梯度算法分析模型对不同荧光峰的响应。结果表明,大头鱼和彩虹鳟的模型在特定的激发和发射波长范围内表现出相似的贡献特征,这说明模型能够有效识别关键的保鲜相关指标。通过对模型的微调,研究还验证了其在不同鱼类间的泛化能力,表明迁移学习在提高模型适应性和减少数据依赖性方面具有重要作用。
本研究的成果不仅为水产品的实时保鲜监测和风险评估提供了新的方法,也为食品供应链中的质量控制和管理提供了理论和技术支持。未来的研究可以进一步扩展模型的应用范围,研究更多种类的水产品,并结合更丰富的荧光物质,以提高模型的全面性和实用性。此外,通过增加样本量和优化模型结构,可以进一步提升模型的预测精度和分类能力,使其在实际应用中发挥更大的作用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号