基于噪声标签校正的高光谱成像技术精准识别霉变花生及其黄曲霉毒素风险

【字体: 时间:2025年06月13日 来源:Food Research International 7.0

编辑推荐:

  针对高光谱图像(HSI)中人工标记噪声导致霉变花生识别准确率低的问题,研究人员提出融合置信度与统计检验(CL-ST)的标签质量量化框架。通过样本外概率估计和统计排序确定最优噪声率(NR),重建模型使霉变花生识别准确率从74.63%提升至98.96%,为食品质量无损检测提供了通用性强、无需超参数的新型解决方案。

  

花生作为全球年产量达4941万吨的重要经济作物,其储存过程中易受真菌污染产生黄曲霉毒素(Aflatoxin)——世界卫生组织定义的I类致癌物。传统化学检测方法虽精确但存在破坏样本、耗时昂贵等缺陷,而高光谱成像(HSI)技术因其兼具光谱化学信息与空间分布特征,成为霉变花生无损检测的研究热点。然而,HSI像素级标记面临根本性挑战:黄曲霉毒素含量无法在像素尺度直接测量,人工标记易受主观判断影响产生噪声标签(Noisy labelling),导致现有模型识别准确率仅74.63%,严重制约工业自动化应用。

中国农业科学院团队在《Food Research International》发表的研究中,创新性提出置信度-统计检验(CL-ST)框架。该研究首先通过霉变实验制备多品种花生样本,采集训练集(36.28%)、验证集(33.40%)和测试集(30.32%)的HSI数据;采用连续投影算法(SPA)和递归特征消除(RFE)筛选特征波长,结合极限学习机(ELM)、随机森林(RF)等算法计算样本外预测概率;进而通过同位素回归校准和Mann-Whitney U检验量化标签质量,最终基于核尺度识别性能确定8.0%-38.5%的最优噪声率(NR)。

Label quality estimation for single pixel
研究采用10折交叉验证评估RFE-ELM等6种组合模型,发现SPA-ELM在置信度估计中表现最优。通过校准后的预测概率构建置信水平(CL),结合统计检验将标签质量分为高、中、低三级,可视化分析证实低质量标签多分布于花生边缘区域。

Conclusion
CL-ST框架成功将霉变花生识别准确率提升至98.96%,精确度达97.09%。特征可视化揭示噪声标签主要扭曲决策边界而非特征选择,SPA-ELM重建模型展现出最优鲁棒性。该技术无需超参数调节,可适配任何分类器,为食品质量HSI检测提供了通用解决方案。

讨论
该研究首次系统量化了HSI中噪声标签对霉变花生识别的影响机制,突破性地将核尺度性能作为NR确定标准,契合工业分选需求。相比传统噪声容忍方法,CL-ST直接定位问题标签且保持特征空间完整性,源代码已开源。未来可扩展至其他真菌毒素检测,推动食品安全智能监测发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号