复杂温室背景下小番茄生长姿态的视觉识别方法与Crop-LoGlobal检测网络研究

【字体: 时间:2025年07月27日 来源:Computers and Electronics in Agriculture 7.7

编辑推荐:

  针对温室复杂背景下小番茄目标边缘模糊、背景干扰严重的检测难题,研究人员提出基于YOLOv7改进的Crop-LoGlobal网络,通过动态图像增强、全局背景抑制模块(MesNet)和小目标特征增强模块(MLCB/MLCA)的两阶段处理,实现96.05%的检测精度,为采摘机器人提供高鲁棒性解决方案。

  

在现代化农业温室中,小番茄的高效采摘一直是个棘手难题。想象一下,采摘机器人面对的是怎样一幅场景:密密麻麻的藤蔓间,成熟的小番茄果实与未成熟的绿色果实混杂生长,叶片遮挡、光线变化、颜色相近的背景干扰……这些因素使得机器"眼睛"常常"看走眼"——要么漏检目标,要么把背景误认为果实。更麻烦的是,小番茄这类目标体积小、边缘特征弱,在复杂背景下极易出现模糊和变形,传统基于颜色和形状的识别方法准确率最低仅有65.1%,这严重制约了自动化采摘的推广应用。

针对这一行业痛点,中国科学技术大学的研究团队在《Computers and Electronics in Agriculture》上发表了一项创新研究。他们独辟蹊径地开发出Crop-LoGlobal检测网络,将小番茄识别准确率提升至96.05%,同时将模型参数量控制在36.219M,在精度与效率间取得了巧妙平衡。这项研究为解决农业场景下小目标检测难题提供了新思路。

研究团队采用了三项核心技术:首先构建了包含不同成熟度小番茄的ComBa数据集;其次设计了两阶段检测框架,先通过动态图像增强技术(结合颜色过滤与空间交叉分析)初步定位目标区域;最后创新性地开发了MesNet(融合多头自注意力MHSA与可变形卷积Dconv)和MLCB/MLCA模块,分别用于全局背景抑制和小目标特征增强。实验采用SIOU损失函数优化边界框回归,在NVIDIA GeForceRTX3090平台上进行验证。

【Construction of small tomato data set】
研究选取市场主流的"粉贝贝"和"千年番茄"品种,建立包含不同背景复杂度(目标与背景相似/不相似共存场景)的数据集,特别关注包含三个以上成熟果实的果穗样本,为模型训练提供真实多样的场景。

【Detection system network】
提出的Crop-LoGlobal网络采用两阶段策略:第一阶段通过实时图像处理技术(颜色增强+空间交叉分析)锁定目标区域,减少非目标区干扰;第二阶段通过MesNet和MLCB/MLCA模块的协同作用,MesNet利用MHSA捕获全局特征、Dconv适应目标几何变形,MLCB通过多尺度局部上下文关联增强小目标表达,MLCA则采用混合池化策略突出关键特征。

【Test design】
在Windows11/Pytorch2.0.1平台上的对比实验显示,该模型在保持实时性的前提下(虽略慢于YOLOv8(n)等轻量模型),准确率显著优于现有方法。消融实验证实MesNet使准确率提升1.16%,MLCB/MLCA组合进一步带来3.64%的增益。

【Discussions】
深入分析表明,该研究的突破在于:1)MHSA与Dconv的融合首次实现了对小番茄生长姿态的几何自适应学习;2)MLCB的局部语义关联有效解决了相似背景导致的特征混淆问题;3)SIOU损失函数使检测框定位精度提高2.3%。这些创新使模型在果实重叠率>30%的复杂场景下仍保持93.7%的准确率。

这项研究的意义不仅在于创造了新的检测精度记录(96.05%),更开创性地将农业先验知识(小番茄生长模式)与深度学习相结合。相比传统方法,该方案对光照变化、遮挡和颜色相近干扰的鲁棒性显著增强,为其他农作物检测提供了可借鉴的技术路线。随着精准农业的发展,这种兼顾精度与效率的检测网络,有望成为智能采摘装备的"标准配置",推动设施农业向更高水平的自动化迈进。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号