基于YOLOv8的多尺度注意力融合辣椒花检测方法改进及其在智能农业中的应用

【字体: 时间:2025年05月28日 来源:Plant Methods 4.7

编辑推荐:

  针对温室环境下人工授粉效率低、成本高的问题,潍坊科技学院研究人员提出了一种基于YOLOv8的辣椒花检测改进方法。通过融合梯度-幅值瓶颈注意力模块(GMBAM)、条件信息编码的C-ELAN层及半内点距离交并比(Semi Inner-MPDIoU)损失函数,模型参数量减少28.7%至2.85M,平均精度(mAP)提升3.1%达87.4%。该研究为农业小目标检测提供了可解释性强的解决方案,相关代码与数据集已开源。

  

在现代化温室种植中,辣椒的人工授粉是保障果实品质的关键环节,但传统方法存在效率低下、操作难度大等问题。随着智能农业技术的发展,基于视觉识别的自动化授粉设备成为研究热点,其中花朵精准检测是核心技术瓶颈。现有方法面临三大挑战:微小目标(辣椒花仅占高分辨率图像极少像素)、复杂背景干扰(枝叶遮挡率超60%),以及环境光照变化导致的特征弱化。尽管YOLO系列算法在农业检测中表现优异,但其原生版本对直径<20像素的花朵检测召回率不足65%。

潍坊科技学院的研究团队在《Plant Methods》发表的研究中,创新性地将视觉特征与生长环境信息融合,构建了改进型YOLOv8框架。通过引入梯度-幅值瓶颈注意力模块(GMBAM),利用图像梯度(G)和幅值(M)映射替代传统池化操作,使小目标特征显著性提升1.8倍;设计条件ELAN(C-ELAN)模块整合MacBert编码的环境参数(如光照周期、温湿度),通过3种卷积核(1×1,3×3,5×5)的多尺度特征提取,解决了背景干扰导致的42%误检率问题;提出半内点距离交并比(Semi Inner-MPDIoU)损失函数,通过动态缩放辅助边界框(Bp-inner)的ratio参数,使收敛速度提升30%。

关键技术包括:1) 基于大气散射模型的低光增强预处理(DeHaze算法);2) 使用COCO数据集迁移学习;3) 多尺度CBAM注意力机制;4) MacBert条件信息编码;5) 改进的MPDIoU损失函数。实验采用自建数据集(3,806张3060×4080分辨率图像,含6类目标),通过余弦退火算法调整学习率至1E-3,训练35,000轮次。

研究结果显示:

  1. 多尺度CBAM边缘增强:在Backbone中嵌入GMBAM后,特征感受野扩大至原模型的1.25倍,长程依赖学习效率提升15%。消融实验表明,单独使用GMBAM可使mAP提高1.3%(85.6% vs 84.3%)。
  2. 条件信息融合:C-ELAN模块需与GMBAM协同使用,将时间、环境等先验知识编码为100维向量,使复杂场景下的检测稳定性提升22%。联合实验组mAP达86.8%。
  3. 损失函数优化:Semi Inner-MPDIoU通过调整ratio∈[1.25,1.35]生成辅助框,有效解决非重叠情况下的梯度消失问题,检测灵活度提高40%。结合功率变换参数α的Alpha-InnerMPDIoU变体,使小目标AP50指标突破89.7%。

最终模型在测试集上实现87.4%的mAP,较基线YOLOv8提升3.1%,参数量减少28.7%。与SAHI辅助的YOLOv8相比,对重叠花朵的漏检率降低19个百分点(7% vs 26%)。讨论部分指出,该方法首次将自然语言处理模型(MacBert)引入农业视觉检测,但存在计算资源消耗较大的局限性。未来可通过轻量化BERT变体(如DistilBERT)优化推理效率,同时探索知识推理机制以应对更复杂的田间场景。该研究为作物表型分析提供了可扩展的技术框架,相关代码已在Google Drive开源,推动农业机器人技术的标准化进程。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号