基于高光谱成像与CNN的花生黄曲霉毒素高通量定量分析:机器学习与深度学习模型的比较评估

【字体: 时间:2025年09月25日 来源:Current Research in Food Science 7

编辑推荐:

  本研究针对花生中黄曲霉毒素(AFT)污染检测存在的破坏性、耗时及高成本问题,创新性地将高光谱成像(HSI)技术与深度学习相结合,开发了一种高效、无损的定量检测方法。通过系统比较传统机器学习(PLSR、RF、LASSO)与卷积神经网络(CNN)模型性能,发现经中值滤波(MF)预处理和遗传算法(GA)特征选择的CNN模型表现最优(R2p=0.972,RMSEp=8.203),为食品工业安全监测提供了可靠的技术支持。

  

花生作为全球重要的经济作物和营养食品来源,富含蛋白质、不饱和脂肪酸、维生素E和多种必需矿物质,在人类饮食和农业经济中扮演着关键角色。然而,花生在种植、储存和加工过程中极易受到黄曲霉(Aspergillus flavus)污染,这种真菌会产生高致癌性的次级代谢产物——黄曲霉毒素(Aflatoxins,AFTs)。其中黄曲霉毒素B1(AFB1)被国际癌症研究机构(IARC)列为1类致癌物,可通过食物链在人体内积累,导致肝毒性、免疫抑制和肝细胞癌等严重健康风险。世界各国都制定了严格的限量标准:中国规定食品和饲料中AFB1不得超过20 μg/kg,欧盟对食用花生的限量为8 μg/kg,美国农业部规定食品中最大允许量为10 μg/kg。

目前黄曲霉毒素检测面临诸多挑战。虽然高效液相色谱法(HPLC)和酶联免疫吸附测定法(ELISA)等常规方法可靠性高,但需要复杂的样品前处理过程,且具有破坏性,不适合高通量或实时监测应用。此外,黄曲霉毒素在花生基质中的不均匀分布增加了采样误差的风险,而痕量污染(μg/kg浓度水平)对检测方法的灵敏度提出了极高要求。

近年来,高光谱成像(HSI)技术因其独特优势在农产品质量和安全监测领域展现出巨大潜力。该技术通过集成光谱分析和图像处理,同时获取空间信息和连续窄带光谱特征,形成三维"图像-光谱融合"数据立方体(x, y, λ)。HSI不仅保留了样品的形态特征,还能检测细微的生化成分变化,从而为无损检测提供多维信息。特别对于黄曲霉毒素检测,HSI可以识别与真菌污染引起的花生组织生化改变相关的特征光谱响应,包括与蛋白质变性和脂质氧化相关的诊断吸收峰。

随着人工智能的发展,深度学习方法在光谱数据分析中表现出极高效率。与传统机器学习算法相比,深度学习模型(如卷积神经网络,CNN)能够通过多次非线性变换从高光谱数据中自主提取高级特征,从而无需手动特征工程。CNN的独特特性,包括局部连接、权重共享和池化操作,使其对高光谱数据中的联合空间-光谱特征具有强大的表示能力。

本研究整合HSI与深度学习算法,建立了快速、无损的花生黄曲霉毒素含量定量检测模型。通过监测霉变过程中的理化性质和微观结构变化,分析相应光谱吸收峰的变化,阐明了生化特性、毒素浓度和诊断光谱波段之间的关系。

研究人员主要采用了以下关键技术方法:使用东北中国白壳花生品种和黄曲霉2219菌株,在三种不同水活性条件下培养样品;通过HPLC进行黄曲霉毒素定量分析;测定水分、脂肪、蛋白质含量和酸值等理化性质;采用扫描电子显微镜观察微观结构变化;利用高光谱成像系统获取900-1700 nm范围的光谱数据;比较六种光谱预处理方法(SNV、MSC、SG-1d、SG-2d、WTD、MF);应用三种特征选择算法(SPA、SFLA、GA);建立四种预测模型(PLSR、RF、LASSO、CNN)并进行性能评估。

3.1. 数据集划分和黄曲霉毒素含量

采用Kennard-Stone算法划分数据集,通过PCA降维可视化。样品分为校准集(70%)、验证集(15%)和预测集(15%),确保训练集全面覆盖整个数据范围。HPLC分析显示,黄曲霉毒素含量范围为:校准集3.01–314.78 μg/kg,验证集3.25–189.34 μg/kg,预测集3.65–187.24 μg/kg。

3.2. 理化性质和样品微观结构变化

研究发现,三组实验样品的水分含量存在显著差异。储存期间脂肪含量总体呈下降趋势,水活性最高的组别减少最明显。花生样品的蛋白质含量总体呈下降趋势,第三组样品在第9至17天间下降较快。酸值在培养期间增加,高水活性组别诱导了协同降解模式。SEM成像显示了真菌定植过程中的渐进性微观结构退化,从早期的细胞质分解到完全的细胞崩溃和营养耗尽。

3.3. 高光谱特征和光谱分析

在224个光谱波段(900-1700 nm)获取高光谱图像。低污染水平样品的平均反射率最低,而严重污染样品显示出较高的反射率。在约940 nm、1163 nm、1360 nm、1410 nm、1571 nm和1710 nm处观察到关键吸收峰,这些吸收峰与脂质、蛋白质和水分的特征吸收相关。

3.4. 光谱预处理方法的比较分析

六种光谱预处理方法在信噪比(SNR)、光谱角制图(SAM)、均方根误差(RMSE)、决定系数(R2)和拟合时间方面存在显著差异。中值滤波(MF)表现出优异的噪声降低性能(SNR=33.61 dB),同时保持最佳预测性能(R2=0.99)。

3.5. 模型评估

比较了四种建模方法(PLSR、RF、LASSO、CNN)在使用全光谱数据和特征子集时的预测性能。CNN模型结合GA特征选择表现出最优性能(R2c=0.9791,RMSEc=7.1245,RPDc=2.7864)。

3.6. 相关性分析

GA选择了30个特征波长,其中1046.2 nm处的VIP得分最高(2.4607)。Pearson相关性分析显示,水分含量、脂肪含量、蛋白质含量与黄曲霉毒素浓度之间存在显著正相关(r>0.9),而酸值与毒素水平呈显著负相关。

3.7. 模型预测结果

机器学习算法应用于花生样品预测集的建模结果显示,PLSR和CNN表现出优于RF和LASSO的预测性能。结合GA特征选择的CNN模型实现了最佳整体性能(R2p=0.972,RMSEp=8.203,RPDp=2.738)。

研究结论表明,本研究基于高光谱成像(900-1700 nm)建立了深度学习预测模型,用于检测花生中的黄曲霉毒素含量。通过理化性质的全面分析和SEM观察微观结构变化,证明了黄曲霉污染导致花生营养成分和细胞结构的显著改变,进而改变了光谱吸收特性。这些发现验证了基于HSI数据和黄曲霉毒素含量建立预测模型的可行性。

相关性分析进一步证实了理化参数、毒素浓度和特征光谱波段之间的显著关系。建模结果表明,使用中值滤波预处理、遗传算法特征选择和卷积神经网络建模可获得最佳预测性能。这种组合证明HSI与CNN结合是检测花生中黄曲霉毒素的有效、快速和无损方法,在生产监测的高通量现场应用中具有巨大潜力。

该研究的重要意义在于为解决花生中黄曲霉毒素污染检测的难题提供了创新性的技术方案。传统的检测方法虽然准确可靠,但存在破坏性、耗时且成本高昂的问题,不适合大规模现场应用。本研究开发的高光谱成像结合深度学习的方法不仅实现了无损检测,还大大提高了检测效率和准确性。

CNN模型能够自动提取高光谱数据中的多层次空间-光谱特征,精确建模复杂的非线性关系,这是传统算法无法比拟的优势。遗传算法的特征选择进一步提高了模型效率,消除了冗余信息,增强了模型的泛化能力。这些技术的结合为食品工业质量控制和安全管理提供了强有力的工具。

然而,研究也存在一些局限性,如相对较小的样本量可能影响模型的泛化能力,单一品种的限制和高设备成本可能制约该技术的未来发展。未来研究需要扩大验证范围,包括更多花生品种和生长条件,开发适合便携式HSI系统的轻量级CNN架构,探索高光谱数据与其他传感模式的融合,最终将模型识别出的最有信息量的波长转化为低成本、基于滤光片的多光谱成像系统,从而实现广泛的工业应用。

该研究成果发表在《Current Research in Food Science》上,为食品安全监测领域提供了重要的方法论见解,可应用于其他农产品的污染物检测,具有广泛的推广价值和实际应用前景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号