基于改进RT-DETR的轻量化实时检测模型GP-DETR在复杂农业环境中近背景色辣椒识别的应用研究

【字体: 时间:2025年07月21日 来源:Smart Agricultural Technology 6.3

编辑推荐:

  为解决温室环境中辣椒检测面临的近色背景干扰、目标遮挡及多尺度分布等难题,研究人员提出基于改进RT-DETR的轻量化模型GP-DETR。通过GELAN主干网络、MsZZMAIFI多尺度模块、BiE-FPN特征融合架构及RCSPBN重参数化模块的协同优化,模型在保持96.4% mAP@0.5精度的同时,参数量降低43%,推理速度达100 FPS,为农业近色目标识别提供了高效解决方案。

  

在智能农业快速发展的背景下,温室辣椒自动化采收面临严峻挑战。由于辣椒果实与枝叶颜色相近、空间分布密集且形态多变,传统人工检测效率低下,而现有深度学习模型存在计算复杂度高、实时性不足等问题。尤其当目标与背景色相似时,YOLO系列算法易受非极大值抑制(NMS)后处理的干扰,导致漏检和误检。这些瓶颈严重制约了农业机器人的精准作业能力。

山西农业大学的研究团队在《Smart Agricultural Technology》发表论文,提出名为GP-DETR的轻量化实时检测模型。该研究创新性地改造RT-DETR架构:采用集成ADown算子与ELA注意力机制的GELAN主干网络提升特征提取效率;设计MsZZMAIFI模块增强多尺度特征交互;构建BiE-FPN通过双边增强机制抑制近色背景干扰;开发RCSPBN模块实现训练-推理双模式参数优化。研究团队在山西太谷区温室采集3,582张包含3个辣椒品种的图像构建数据集,通过150轮次训练验证模型性能。

关键技术包括:1)基于梯度路径规划的RepNCSPELAN4E2主干网络;2)融合多尺度空洞卷积与通道注意力的MsZZMAIFI模块;3)采用SBA单元的双向增强特征金字塔BiE-FPN;4)具有重参数化特性的RCSPBN模块。

3.1 主干网络对比
RepNCSPELAN4E2在参数量(40MB)和计算量(33.5 GFLOPs)显著低于ResNet-18等传统主干,同时保持96.2% mAP@0.5精度,推理速度达108 FPS。

3.2 消融实验
完整模型GP-DETR相较基线RT-DETR参数减少42.7%,FPS提升至100。可视化显示BiE-FPN使目标区域激活强度提升37%,背景干扰响应降低29%。

3.3 注意力机制对比
ELA注意力以96.4% mAP@0.5优于MLCA、SimAM等机制,在遮挡场景下误检率降低18%。

3.4 模型性能对比
GP-DETR在参数量(43.4MB)仅为YOLOv8m的44%情况下,mAP@0.5超越YOLOv10b 0.3个百分点,推理速度较YOLOv9m提高31.6%。

3.5 可视化分析
Grad-CAM++显示GP-DETR在枝叶遮挡场景下激活区域聚焦度比RT-DETR提高2.3倍,多尺度目标检测中小物体响应强度提升41%。

该研究通过模块化设计实现精度与效率的平衡,首次将RT-DETR架构应用于农业近色目标检测。模型在黄瓜等作物的跨物种验证中保持95.1% mAP@0.5,证实其泛化能力。未来可通过恶劣天气数据增强和嵌入式部署优化,进一步推动农业视觉系统的实用化进程。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号