《Computers and Electronics in Agriculture》:Real-time and explainable non-destructive nut classification using spike-triggered acoustic sensing
编辑推荐:
本文针对传统坚果质量检测方法效率低、成本高且难以集成自动化产线的问题,研究团队提出了一种基于脉冲触发声学感知的在线核桃分类系统。通过结合FFT能量谱和MFCC特征,利用随机森林分类器实现实时分类,F1分数高达0.93。该技术为非破坏性食品质量监测提供了高效可靠的工业解决方案。
在全球食品安全形势日益严峻的背景下,坚果质量检测仍严重依赖效率低下的人工筛选或破坏性检测方法。传统视觉检测易受环境光线干扰,化学传感器难以捕捉内部结构特征,而基于深度学习的方案又面临计算复杂度高、缺乏可解释性的困境。这些问题严重制约了坚果加工行业的高效自动化发展。
为解决上述挑战,意大利的里雅斯特大学研究团队在《Computers and Electronics in Agriculture》发表论文,创新性地提出基于脉冲触发声学感知的在线坚果分类系统。该研究通过分析核桃撞击金属板产生的声学信号,结合快速傅里叶变换(FFT)和梅尔频率倒谱系数(MFCC)特征提取,利用随机森林(Random Forest)分类器实现了对三种核桃品类(Lara Calibro/LC、Lara Void/LV、Chandler Void/CV)的精准区分,最高分类F1分数达0.94,单样本处理时间仅7.88毫秒,为工业级实时质量监控提供了新范式。
关键技术方法包括:1)搭建倾斜45度的滑道装置采集核桃撞击声学信号;2)采用幅值阈值触发的不对称时间窗分割策略提取声学片段;3)融合24维FFT能量带和128维MFCC特征构建172维特征向量;4)使用包含100棵决策树的随机森林分类器进行模型训练与实时预测。实验涉及3,489个核桃样本,涵盖59段连续音频流数据。
5.1. MFCC配置消融研究
通过比较12/42/128维MFCC特征发现,128维系数在LC-CV分类任务中表现最优(F1-score 0.95),虽略微增加计算耗时(5.05 ms),但显著提升分类精度。
5.2. LC与LV识别
二元分类任务中,系统对完整核桃(LC)与空壳核桃(LV)的区分达到0.93的F1值。特征贡献度分析显示MFCC特征(F1 0.92)比纯频谱特征(F1 0.65)更具判别力,说明感知声学特征更能捕捉内部结构差异。
5.3. CV、LC与LV多类别识别
三分类任务平均F1值达0.91,其中CV样本识别精度最高(F1 0.92)。决策谓词图(DPG)分析发现fft_bin_0(低频能量)和mfcc_37等特征构成关键决策节点,揭示不同品类声学签名差异主要集中于低频能量分布。
5.4. CV与LC识别
该二元任务取得最佳性能(F1 0.94),DPG显示fft_bin_0>0.2等规则占据中心地位,表明Chandler品种与Lara品种的声学特征具有明显可分性。
5.5. 计算性能分析
在Intel i7-12700K平台测试显示,系统吞吐量达7,620个/分钟,远超传统检测效率。与SVM、MLP等模型对比,随机森林在精度(95%)与可解释性间取得最佳平衡。
研究通过决策谓词图(Decision Predicate Graph)技术首次实现了声学分类模型的可视化解读,发现fft_bin_0阈值规则在多数分类任务中具有最高介数中心性(0.28-0.33)。这种可解释性设计使工业生产中能够追溯分类决策依据,例如当mfcc_37≤6.2时样本更可能被判为空心核桃,该发现与坚果内部空腔会削弱中频声学共振的物理规律一致。
该研究的意义在于创建了首个适用于工业高速分选场景的脉冲触发声学检测框架,通过轻量级特征工程与可解释机器学习模型的结合,突破了传统声学检测需长时录音或复杂深度模型的限制。未来工作可扩展至杏仁、开心果等坚果品类,并通过嵌入式硬件优化进一步推动农业4.0智能检测技术的发展。