《Journal of Food Measurement and Characterization》:Classification of Turkish hazelnut (Corylus colurna L.) varieties: a comparative study of YOLOv8 and fine-tuned vision transformer
编辑推荐:
土耳其黑海地区榛子种植经济重要,营养丰富。基于YOLOv8和Vision Transformer的模型测试显示,ViT-Base/16在2,722张图像分类中达到99.75%准确率,优于YOLOv8系列模型,为农业自动化提供新方案。
摘要
榛子是一种适合黑海地区温带湿润气候的灌木植物,该地区以冬季气候温和而闻名。土耳其在全球榛子生产中扮演着关键角色。榛子不仅是该国经济的重要农产品,还因其丰富的营养成分(尤其是健康油脂和蛋白质)及其带来的健康益处而备受重视。本研究利用现代深度学习技术对不同种类的榛子进行分类,旨在自动区分八种常见的栽培品种:caklidak、damat、devedisi、sivri、karafindik、palaz、tombul和yagli。研究采用了YOLOv8分类模型和经过微调的Vision Transformer(ViT)来对包含2,722张标注图像的数据集进行分类。测试了多种YOLOv8模型配置,包括YOLOv8n-cls、YOLOv8s-cls、YOLOv8m-cls、YOLOv8l-cls和YOLOv8x-cls,同时对比了经过系统微调优化的ViT-Base/16模型。结果表明,经过微调的Vision Transformer取得了99.75%的最高分类准确率,创下了该数据集的新最佳记录。在YOLOv8模型中,YOLOv8s-cls和YOLOv8l-cls的准确率分别为99.25%,而最轻量的YOLOv8n-cls模型准确率为97.38%。ViT-Base/16(99.75%)的优异表现相较于以往研究有了显著提升,证明了基于Transformer的架构结合迁移学习在农业图像分类中的有效性。这些发现凸显了该技术在现实农业应用中的巨大潜力,Vision Transformer实现了近乎完美的分类准确率。研究表明,先进的计算机视觉技术,尤其是经过微调的基于Transformer的模型,能够有效自动化农产品的识别和质量控制,从而提高食品加工和供应链的效率。
榛子是一种适合黑海地区温带湿润气候的灌木植物,该地区以冬季气候温和而闻名。土耳其在全球榛子生产中扮演着关键角色。榛子不仅是该国经济的重要农产品,还因其丰富的营养成分(尤其是健康油脂和蛋白质)及其带来的健康益处而备受重视。本研究利用现代深度学习技术对不同种类的榛子进行分类,旨在自动区分八种常见的栽培品种:caklidak、damat、devedisi、sivri、karafindik、palaz、tombul和yagli。研究采用了YOLOv8分类模型和经过微调的Vision Transformer(ViT)来对包含2,722张标注图像的数据集进行分类。测试了多种YOLOv8模型配置,包括YOLOv8n-cls、YOLOv8s-cls、YOLOv8m-cls、YOLOv8l-cls和YOLOv8x-cls,同时对比了经过系统微调优化的ViT-Base/16模型。结果表明,经过微调的Vision Transformer取得了99.75%的最高分类准确率,创下了该数据集的新最佳记录。在YOLOv8模型中,YOLOv8s-cls和YOLOv8l-cls的准确率分别为99.25%,而最轻量的YOLOv8n-cls模型准确率为97.38%。ViT-Base/16(99.75%)的优异表现相较于以往研究有了显著提升,证明了基于Transformer的架构结合迁移学习在农业图像分类中的有效性。这些发现凸显了该技术在现实农业应用中的巨大潜力,Vision Transformer实现了近乎完美的分类准确率。研究表明,先进的计算机视觉技术,尤其是经过微调的基于Transformer的模型,能够有效自动化农产品的识别和质量控制,从而提高食品加工和供应链的效率。