基于轻量化改进YOLOv8n模型的边缘设备部署实现高精度Orah果实实时检测

【字体: 时间:2025年05月15日 来源:Artificial Intelligence in Agriculture 8.2

编辑推荐:

  本研究针对柑橘类水果采摘环节劳动强度大、传统机器视觉方法在复杂果园环境中适应性差的问题,提出了一种轻量化改进的YOLOv8n模型。通过引入ADown模块、C3_DualConv模块、BiFPN结构和CA注意力机制,结合Focaler-MPDIoU损失函数,在保持4.1MB模型体积下实现97.7%的检测精度和30fps实时性能,为基于边缘设备的智能采摘机器人提供了关键技术支撑。

  

【研究背景】
在中国这个全球最大的柑橘生产国,2023年柑橘产量高达6433.76万吨,其中Orah果实因其独特风味成为南方重要经济作物。然而传统采摘作业50%-70%工作量集中在收获环节,完全依赖人工。虽然学者们尝试用LBP特征+SVM等传统机器视觉方法(如Zhuang等2018年86%识别率),但存在光照敏感、遮挡处理能力弱等缺陷。近年来YOLO系列模型在农业检测中展现优势,但如何在保持精度的前提下实现边缘设备部署仍是关键挑战。

【研究方法】
广西某研究团队通过iPhone 12 Pro Max和华为Honor 10采集844张Orah果实图像,经翻转、旋转等数据增强至3376张,按7:1.5:1.5划分数据集。基于YOLOv8n模型进行五项改进:(1)用ADown模块替换部分卷积层减少87.1%模型体积;(2)设计C3_DualConv双卷积瓶颈增强遮挡特征提取;(3)引入含P2层的BiFPN结构优化多尺度特征融合;(4)在P3-P5特征层添加CA(Coordinate Attention)坐标注意力机制;(5)采用Focaler-MPDIoU联合损失函数提升密集遮挡检测。最终模型通过TensorRT Python API部署至Nvidia Jetson Orin Nano边缘设备。

【研究结果】

  1. 模型性能验证
    改进后模型参数量降至1.9M(减少36.88%),FLOPs 5.7G(降29.63%),在保持4.1MB体积下实现97.7%精度(P)、95.7%召回率(R)和98.8% AP@0.5。热图分析显示C3_DualConv使注意力更聚焦果实核心区域(图12),CA机制显著增强边缘特征识别(图14)。

  2. 对比实验
    相较于YOLOv8n基线模型,改进模型P提升1.4%,F1提高0.14%。在边缘设备部署后,经TensorRT优化使推理速度提升58.11%至35.57fps(表6),实时检测中未出现精度损失(图21)。

  3. 实际应用验证
    使用RealSense D455工业相机采集的测试集显示平均97.4% P和98.76% AP@0.5(表7),在背光、枝叶遮挡等复杂场景下保持稳定性能(图22)。

【结论意义】
该研究通过模块化轻量化设计,在YOLOv8n中实现精度与效率的平衡。特别地:
• ADown模块通过最大池化与卷积双路径(公式1-4)实现高效下采样
• C3_DualConv中3×3与1×1卷积组合(图7)提升局部特征提取
• BiFPN加入P2高分辨率层(图8B)增强多尺度融合
• CA机制通过坐标嵌入(图9)扩大感受野
• Focaler-MPDIoU(公式9)优化困难样本处理

虽然模型在极端遮挡下召回率略有下降,但4.1MB体积和30fps性能使其成为目前边缘设备部署的最佳选择。该成果为果园自动化采摘提供了可直接落地的技术方案,相关代码已开源。未来研究可进一步优化小目标检测能力,并探索与其他传感器数据的融合应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号