基于机器视觉与手工特征融合的细粒度小米分类方法研究

《Scientific Reports》:A hybrid machine vision and handcrafted features fusion based approach for fine-grained millet classification

【字体: 时间:2025年12月17日 来源:Scientific Reports 3.9

编辑推荐:

  为解决小米品种间形态相似度高、传统分类方法效率低且易出错的问题,研究人员开展了一项基于机器视觉与手工特征融合的细粒度小米分类研究。他们提出了两种混合框架:一种基于手工特征(形状、纹理、LBP)的堆叠集成机器学习模型(SVM、RF、KNN),另一种是融合手工特征与预训练VGG19的双向深度学习架构。研究结果表明,两种模型均表现出色,其中堆叠集成模型分类准确率达到97%,而VGG19混合模型在保持优异性能的同时,在训练与推理时间上取得了最佳平衡,为农业智能分选提供了高效可靠的解决方案。

  
小米,这种被誉为“超级谷物”的作物,因其卓越的耐旱性、高营养价值和低环境足迹,正成为全球应对粮食安全和气候变化挑战的关键作物。然而,在小米的育种、加工和贸易环节,一个看似简单却极为棘手的问题长期存在:如何快速、准确地识别不同品种的小米?巴恩亚德小米(Barnyard Millet)、小小米(Little Millet)和普罗索小米(Proso Millet)等品种在形态上极为相似,仅凭肉眼观察极易混淆,这不仅影响了育种工作的效率,也制约了小米产业的标准化和市场化进程。
传统的分类方法主要依赖人工经验或生化检测,前者主观性强、效率低下,后者则耗时耗力且成本高昂。随着人工智能技术的兴起,利用计算机视觉进行作物分类已成为研究热点。然而,直接将现有的深度学习模型应用于小米分类,也面临着严峻的挑战。一方面,小米品种间的差异属于“细粒度”差异,即类间差异远小于类内差异,这对模型的判别能力提出了极高要求;另一方面,公开的小米图像数据集极为稀缺,数据量的不足容易导致复杂的深度学习模型过拟合,难以泛化到实际应用场景。
为了攻克这些难题,Baisakha B.、Prabira Kumar Sethy等研究人员在《Scientific Reports》上发表了一项创新性研究。他们独辟蹊径,将传统图像处理技术与前沿的机器学习、深度学习模型相结合,提出了两种新颖的混合框架,旨在实现高精度、高效率的小米品种分类。
关键技术方法
为了开展这项研究,研究人员首先构建了一个包含巴恩亚德小米、小小米和普罗索小米三个品种共1255张图像的自定义数据集。在模型构建方面,他们采用了两种核心策略:一是基于手工特征的堆叠集成机器学习模型,该模型通过提取形状(面积、周长)、纹理(GLCM对比度、同质性、能量)和局部二值模式(LBP)等15维手工特征,并利用K近邻(KNN)、支持向量机(SVM)和随机森林(RF)作为基分类器,通过多项式逻辑回归进行元学习;二是基于手工特征融合的VGG19混合模型,该模型将预训练的VGG19网络提取的深度特征与上述手工特征进行拼接,构建了一个双向的深度学习架构,以充分利用深度特征和手工特征的互补优势。
研究结果
1. 基于手工特征的堆叠集成机器学习模型性能
研究人员首先评估了基于手工特征的堆叠集成模型的分类性能。该模型在测试集上取得了令人瞩目的97%的准确率。分类报告显示,该模型在三个小米品种上的表现均非常均衡,宏平均和加权平均的精确率、召回率和F1分数均达到0.97。这表明该模型不仅整体分类能力强,而且对每个类别的识别都保持了高水准。与单一的传统机器学习模型(如SVM、RF、KNN)相比,该堆叠集成模型在准确率上实现了显著提升,证明了集成学习策略在整合不同分类器优势方面的有效性。
2. 基于手工特征融合的VGG19混合模型性能
为了进一步提升分类性能,研究人员提出了第二种模型——基于手工特征融合的VGG19混合模型。该模型的表现更为全面,在测试集上取得了96.7%的准确率、0.9681的精确率、0.9670的召回率和0.9670的F1分数。尤为突出的是,其受试者工作特征曲线下面积(ROC-AUC)高达0.9953,表明该模型具有极强的类别区分能力,几乎不存在误分类的风险。
3. 模型综合比较与效率分析
为了全面评估所提模型的优越性,研究人员将其与多种主流的深度学习模型进行了横向比较,包括VGG19、ResNet50、EfficientNetB0和MobileNetV2。结果显示,所提出的VGG19混合模型在准确率、精确率、召回率和F1分数等所有关键性能指标上均显著优于其他模型。在计算效率方面,该模型在训练时间和推理时间上均保持了合理的水平,远优于EfficientNetB0和ResNet50等更深的网络。最终,通过综合考虑性能与效率的权衡,所提出的VGG19混合模型获得了最高的综合性能得分(0.9696),证明了其在保持高精度的同时,也具备良好的实用性和部署潜力。
结论与讨论
本研究通过系统性的实验,成功验证了混合特征融合策略在细粒度小米分类任务中的巨大潜力。研究结论可以概括为以下三点:
首先,手工特征在细粒度分类中依然具有不可替代的价值。基于手工特征的堆叠集成机器学习模型取得了97%的准确率,这一结果不仅证明了手工特征(如形状、纹理和LBP)对于区分形态相似的小米品种具有强大的判别能力,也为小样本条件下的分类任务提供了一个高效、可解释的解决方案。
其次,深度特征与手工特征的融合能够产生“1+1>2”的效果。所提出的VGG19混合模型通过将预训练VGG19网络提取的抽象、高层次的深度特征与具体、可解释的手工特征进行融合,构建了一个信息更丰富、判别力更强的特征表示。该模型在各项指标上的全面领先,证明了这种双向信息融合策略能够有效弥补单一特征源的不足,从而在复杂的细粒度分类任务中取得突破性进展。
最后,该研究为农业领域的智能分选技术提供了重要的技术基准。所提出的两种模型框架,特别是VGG19混合模型,在实现高精度分类的同时,兼顾了计算效率,为开发低成本、高效率的田间或加工厂智能分选设备奠定了坚实的理论基础。这项研究不仅填补了小米品种智能识别领域的空白,也为其他具有细粒度识别需求的农业应用提供了可借鉴的技术范式。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号