基于轻量化改进YOLOv8n模型的边缘设备部署实现高精度Orah果实实时检测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年05月15日 来源：Artificial Intelligence in Agriculture 8.2

编辑推荐：

　　本研究针对柑橘类水果采摘环节劳动强度大、传统机器视觉方法在复杂果园环境中适应性差的问题，提出了一种轻量化改进的YOLOv8n模型。通过引入ADown模块、C3_DualConv模块、BiFPN结构和CA注意力机制，结合Focaler-MPDIoU损失函数，在保持4.1MB模型体积下实现97.7%的检测精度和30fps实时性能，为基于边缘设备的智能采摘机器人提供了关键技术支撑。

【研究背景】
在中国这个全球最大的柑橘生产国，2023年柑橘产量高达6433.76万吨，其中Orah果实因其独特风味成为南方重要经济作物。然而传统采摘作业50%-70%工作量集中在收获环节，完全依赖人工。虽然学者们尝试用LBP特征+SVM等传统机器视觉方法（如Zhuang等2018年86%识别率），但存在光照敏感、遮挡处理能力弱等缺陷。近年来YOLO系列模型在农业检测中展现优势，但如何在保持精度的前提下实现边缘设备部署仍是关键挑战。

【研究方法】
广西某研究团队通过iPhone 12 Pro Max和华为Honor 10采集844张Orah果实图像，经翻转、旋转等数据增强至3376张，按7:1.5:1.5划分数据集。基于YOLOv8n模型进行五项改进：（1）用ADown模块替换部分卷积层减少87.1%模型体积；（2）设计C3_DualConv双卷积瓶颈增强遮挡特征提取；（3）引入含P2层的BiFPN结构优化多尺度特征融合；（4）在P3-P5特征层添加CA（Coordinate Attention）坐标注意力机制；（5）采用Focaler-MPDIoU联合损失函数提升密集遮挡检测。最终模型通过TensorRT Python API部署至Nvidia Jetson Orin Nano边缘设备。

【研究结果】

模型性能验证
改进后模型参数量降至1.9M（减少36.88%），FLOPs 5.7G（降29.63%），在保持4.1MB体积下实现97.7%精度（P）、95.7%召回率（R）和98.8% AP@0.5。热图分析显示C3_DualConv使注意力更聚焦果实核心区域（图12），CA机制显著增强边缘特征识别（图14）。
对比实验
相较于YOLOv8n基线模型，改进模型P提升1.4%，F1提高0.14%。在边缘设备部署后，经TensorRT优化使推理速度提升58.11%至35.57fps（表6），实时检测中未出现精度损失（图21）。
实际应用验证
使用RealSense D455工业相机采集的测试集显示平均97.4% P和98.76% AP@0.5（表7），在背光、枝叶遮挡等复杂场景下保持稳定性能（图22）。

【结论意义】
该研究通过模块化轻量化设计，在YOLOv8n中实现精度与效率的平衡。特别地：
• ADown模块通过最大池化与卷积双路径（公式1-4）实现高效下采样
• C3_DualConv中3×3与1×1卷积组合（图7）提升局部特征提取
• BiFPN加入P2高分辨率层（图8B）增强多尺度融合
• CA机制通过坐标嵌入（图9）扩大感受野
• Focaler-MPDIoU（公式9）优化困难样本处理

虽然模型在极端遮挡下召回率略有下降，但4.1MB体积和30fps性能使其成为目前边缘设备部署的最佳选择。该成果为果园自动化采摘提供了可直接落地的技术方案，相关代码已开源。未来研究可进一步优化小目标检测能力，并探索与其他传感器数据的融合应用。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号