家禽产品的完美检测——比较用于在生产环境中检测和分类家禽产品的计算机视觉模型
《Applied Food Research》:Poultry perfection — Comparison of computer vision models to detect and classify poultry products in a production setting
【字体:
大
中
小
】
时间:2025年11月21日
来源:Applied Food Research 6.2
编辑推荐:
计算机视觉通过目标检测技术用于评估即食鸡肉产品质量,区分“合格”与“缺陷”产品。研究比较了YOLOv5至v12及D-FINE等模型,发现数据增强(如镜像、亮度调整)和预训练模型能有效提升准确率(最高mAP50-95达0.9368)。实验表明,模型选择影响较小,数据量和标注质量更为关键,且当前模型在复杂生产环境中仍存在误分类问题。未来方向包括多类别缺陷分类和结合时序数据优化检测。
在当今社会,随着全球人口的持续增长以及各种社会危机的不断出现,食品供应链的各个环节都需要不断改进,以确保食品生产的安全性和质量。与此同时,人工智能和机器学习技术的快速发展为食品工业提供了新的解决方案。本文研究了计算机视觉技术,特别是目标检测方法,如何用于即食肉制品的质量控制。重点在于通过识别“好产品”与“不完美产品”之间的差异,提高自动化检测的准确性和效率。这些不完美产品可能在形状、大小或颜色等方面存在偏差,例如出现孔洞、缺少边缘、颜色过深的颗粒等,但并不意味着这些产品无法食用或存在食品安全风险,只是影响了整体质量。
在食品质量控制领域,尽管计算机视觉技术已有广泛应用,但大多数研究仍局限于受控实验室环境,且通常只关注单一模型架构的评估,这使得其在实际生产中的适用性受到限制。为了弥补这一不足,本文将多种先进的目标检测模型应用于实际的鸡肉加工流程中,通过对比实验评估其在真实环境下的表现。本文所采用的模型包括YOLO系列的不同版本,以及RT-DETR和D-FINE等基于视觉Transformer(ViT)的模型。研究结果显示,大多数模型在mAP50-95指标上达到了0.9以上的准确率,其中YOLO12模型在该指标上取得了0.9359的高分,表明其在检测“不完美产品”方面具有显著优势。这可能是因为“不完美产品”在数据集中出现的频率较高,使得模型在学习该类别时更加有效。
为了提高模型的性能,本文不仅考虑了数据集的构建,还对数据增强和超参数调优进行了探索。数据增强是通过变换图像,如水平翻转、调整亮度和对比度、灰度转换以及颜色通道的随机打乱等方式,来扩大训练数据集的规模。这种方法可以有效防止模型过拟合,并增强其对不同场景的适应能力。然而,数据收集和标注的过程通常耗时且劳动密集,因此增加数据量可能不是最实际的解决方案。相反,超参数调优可能是一种更可行的手段,通过调整学习率、权重衰减等参数,可以在不增加数据量的情况下提升模型的性能。
尽管YOLO12模型在整体性能上表现良好,但其超参数调优后的版本并未显著优于默认设置。这表明,模型本身的性能在很大程度上依赖于数据集的质量和多样性。因此,本文强调,构建高质量、一致标注的数据集对于实现良好的模型性能至关重要。在实际应用中,如何获取和标注数据仍然是一个主要挑战。此外,本文的实验还揭示了模型在某些边缘情况下的表现不佳,例如在灰度图像或颜色通道被打乱的图像上,检测效果显著下降。这说明,模型在训练时如果没有涵盖这些特殊情形,就可能在实际应用中出现误判。
为了验证模型的性能,本文采用了多种评估指标,包括精确率、召回率、F1分数和mAP。这些指标从不同角度衡量模型的检测能力和分类准确性。例如,精确率衡量模型正确识别的实例占所有识别实例的比例,而召回率衡量模型正确识别的实例占所有实际存在的实例的比例。F1分数则综合了精确率和召回率,提供了更全面的性能评估。mAP则衡量模型在不同IoU阈值下的平均精度,是评估目标检测模型的重要指标。
在实验过程中,研究人员还利用了混淆矩阵来分析模型的预测结果。通过混淆矩阵,可以清晰地看到模型在不同类别之间的分类情况。例如,对于“好产品”类别,模型在低置信度时表现良好,但随着置信度的增加,精确率和召回率均出现下降。相比之下,“不完美产品”类别在大多数置信度下都保持较高的召回率,这表明该类别的样本在数据集中占据较大比例,使得模型更容易学习其特征。然而,一些误分类仍然存在,如将某些背景图像误判为“不完美产品”或未检测到某些实际存在的“好产品”对象。
此外,本文还探讨了模型训练过程中的一些关键因素,如图像尺寸、训练轮次和批量大小。这些参数对模型的训练效率和最终性能有重要影响。例如,较大的图像尺寸可以提高检测精度,但也会增加计算负担;更多的训练轮次有助于模型更好地学习数据特征,但过高的轮次可能导致过拟合;较大的批量大小可以加快训练速度,但可能影响模型的泛化能力。因此,在实际应用中,需要根据具体需求平衡这些参数,以达到最佳效果。
为了进一步提升模型的性能,本文还尝试了超参数调优,使用Ultralytics提供的工具对YOLO12模型进行了调优。尽管调优过程花费了大量时间和计算资源,但结果表明,调优后的模型并未显著优于默认设置。这说明,对于某些任务,模型的默认参数可能已经足够好,而进一步调优可能带来有限的收益。同时,调优过程也揭示了模型在某些参数上的敏感性,例如学习率和权重衰减等。这些参数的微小调整可能会对模型的性能产生较大影响,因此在调优过程中需要谨慎选择。
在数据集构建方面,本文采用了一种较为实际的方法,即在实际生产过程中采集图像,并通过人工标注和自动化工具(如GroundingDINO和Label Studio)来完成数据的预处理。这种方式不仅能够确保数据的真实性和多样性,还能反映实际生产中的各种情况,如光照变化、产品摆放方式的不同等。然而,由于标注过程耗时,因此数据集的规模受到一定限制。尽管如此,通过数据增强,研究人员成功地将数据集的规模扩大了近一倍,从而提高了模型的泛化能力。
在实际应用中,计算机视觉技术可以显著提高食品质量控制的效率和准确性。然而,模型的性能仍然受到多种因素的影响,如数据集的平衡性、标注的一致性以及训练过程中的超参数设置。因此,未来的研究方向可能包括构建更大、更全面的数据集,以涵盖更多的生产场景和产品类型;优化标注流程,以提高数据质量;以及探索更先进的模型架构,以适应更复杂的检测任务。此外,还可以考虑将计算机视觉技术与其他人工智能技术相结合,例如深度学习和机器学习,以实现更全面的食品质量分析。
总的来说,本文的研究表明,虽然计算机视觉模型在某些情况下可以达到较高的检测准确率,但其性能仍然高度依赖于数据集的质量和标注的准确性。因此,在实际应用中,构建一个多样化、高质量的数据集可能是提升模型性能的关键。此外,对于某些特定的检测任务,如区分“好产品”和“不完美产品”,可以考虑使用更复杂的模型架构或引入更先进的技术,如多类别分类和时间序列分析,以进一步提高检测的精度和可靠性。未来的研究可以聚焦于这些方面,以推动计算机视觉技术在食品工业中的更广泛应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号