
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于轻量化改进YOLOv8n模型的边缘设备部署实现高精度Orah果实实时检测
【字体: 大 中 小 】 时间:2025年05月15日 来源:Artificial Intelligence in Agriculture 8.2
编辑推荐:
本研究针对柑橘类水果采摘环节劳动强度大、传统机器视觉方法在复杂果园环境中适应性差的问题,提出了一种轻量化改进的YOLOv8n模型。通过引入ADown模块、C3_DualConv模块、BiFPN结构和CA注意力机制,结合Focaler-MPDIoU损失函数,在保持4.1MB模型体积下实现97.7%的检测精度和30fps实时性能,为基于边缘设备的智能采摘机器人提供了关键技术支撑。
【研究背景】
在中国这个全球最大的柑橘生产国,2023年柑橘产量高达6433.76万吨,其中Orah果实因其独特风味成为南方重要经济作物。然而传统采摘作业50%-70%工作量集中在收获环节,完全依赖人工。虽然学者们尝试用LBP特征+SVM等传统机器视觉方法(如Zhuang等2018年86%识别率),但存在光照敏感、遮挡处理能力弱等缺陷。近年来YOLO系列模型在农业检测中展现优势,但如何在保持精度的前提下实现边缘设备部署仍是关键挑战。
【研究方法】
广西某研究团队通过iPhone 12 Pro Max和华为Honor 10采集844张Orah果实图像,经翻转、旋转等数据增强至3376张,按7:1.5:1.5划分数据集。基于YOLOv8n模型进行五项改进:(1)用ADown模块替换部分卷积层减少87.1%模型体积;(2)设计C3_DualConv双卷积瓶颈增强遮挡特征提取;(3)引入含P2层的BiFPN结构优化多尺度特征融合;(4)在P3-P5特征层添加CA(Coordinate Attention)坐标注意力机制;(5)采用Focaler-MPDIoU联合损失函数提升密集遮挡检测。最终模型通过TensorRT Python API部署至Nvidia Jetson Orin Nano边缘设备。
【研究结果】
模型性能验证
改进后模型参数量降至1.9M(减少36.88%),FLOPs 5.7G(降29.63%),在保持4.1MB体积下实现97.7%精度(P)、95.7%召回率(R)和98.8% AP@0.5。热图分析显示C3_DualConv使注意力更聚焦果实核心区域(图12),CA机制显著增强边缘特征识别(图14)。
对比实验
相较于YOLOv8n基线模型,改进模型P提升1.4%,F1提高0.14%。在边缘设备部署后,经TensorRT优化使推理速度提升58.11%至35.57fps(表6),实时检测中未出现精度损失(图21)。
实际应用验证
使用RealSense D455工业相机采集的测试集显示平均97.4% P和98.76% AP@0.5(表7),在背光、枝叶遮挡等复杂场景下保持稳定性能(图22)。
【结论意义】
该研究通过模块化轻量化设计,在YOLOv8n中实现精度与效率的平衡。特别地:
• ADown模块通过最大池化与卷积双路径(公式1-4)实现高效下采样
• C3_DualConv中3×3与1×1卷积组合(图7)提升局部特征提取
• BiFPN加入P2高分辨率层(图8B)增强多尺度融合
• CA机制通过坐标嵌入(图9)扩大感受野
• Focaler-MPDIoU(公式9)优化困难样本处理
虽然模型在极端遮挡下召回率略有下降,但4.1MB体积和30fps性能使其成为目前边缘设备部署的最佳选择。该成果为果园自动化采摘提供了可直接落地的技术方案,相关代码已开源。未来研究可进一步优化小目标检测能力,并探索与其他传感器数据的融合应用。
生物通微信公众号
知名企业招聘