
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于YOLOv8m轻量化改进的机器人视觉小黄瓜分拣与码垛优化研究
【字体: 大 中 小 】 时间:2025年08月10日 来源:Journal of Agriculture and Food Research 6.2
编辑推荐:
为解决农业自动化中边缘设备部署深度学习模型的难题,研究人员通过FasterNet Block替换C2f模块、引入AFPN特征金字塔网络及WIoU v3损失函数,对YOLOv8m进行轻量化改进。改进后模型参数量减少63.15%,检测精度提升0.2%,为资源受限场景下的果蔬分拣机器人提供高效技术方案。
在现代化农业中,小黄瓜因其高经济价值成为重要经济作物,但其分拣码垛仍依赖人工操作,效率低下且成本高昂。传统机器视觉方法如支持向量机(SVM)和随机森林(RF)依赖人工特征设计,难以应对复杂农业环境。尽管基于卷积神经网络(CNN)的深度学习模型如YOLO系列展现出优越性能,但其高计算资源需求成为边缘设备部署的瓶颈。
中国农业机械化科学研究院集团公司的研究人员在《Journal of Agriculture and Food Research》发表研究,针对小黄瓜分拣机器人的视觉识别需求,提出一种基于YOLOv8m的轻量化改进方案。通过构建包含860张图像的多尺度数据集,采用FasterNet Block替换原C2f模块中的Bottleneck结构,引入渐进式特征金字塔网络(AFPN)优化检测头,并采用动态非单调聚焦机制的WIoU v3损失函数。
关键技术包括:1) 基于工业相机的标准化数据采集系统;2) 采用PConv(部分卷积)的FasterNet Block降低计算冗余;3) AFPN渐进融合多尺度特征;4) WIoU v3增强边界框回归性能。
【Backbone Network Improvement】
实验表明,FasterNet Block使参数量减少35.73%,FLOPs降低37.04%,mAP@50:95提升0.8%。相比ShuffleNetV2和ResNet,在精度与轻量化间取得更好平衡。
【Improvement of the Head Network】
AFPN通过渐进融合策略将特征图维度压缩至1/4,参数量减少63.15%,在保持99.4% mAP@50的同时显著降低模型复杂度。
【Improvement of the Loss Function】
WIoU v3通过动态梯度调整机制,使精度达99.9%,较CIoU提升0.4个百分点,有效解决小目标检测中的语义间隙问题。
【Validation and Analysis】
改进模型在RTX 3060平台实现49.02 FPS实时检测,模型尺寸仅18.8MB。消融实验证实三阶段优化具有协同效应,最终模型在参数量减少63.15%情况下,mAP@50反升0.2%。
该研究创新性地将轻量化技术与农业场景深度融合,为边缘计算设备部署高性能视觉模型提供新思路。未来可结合零样本检测和跨模态微调范式,进一步拓展模型在开放语义环境下的适应性,推动农业机器人向认知智能化方向发展。论文通过系统性的结构优化,实现了精度与效率的协同提升,对智能农业装备研发具有重要参考价值。
生物通微信公众号
知名企业招聘