基于YOLOv5s的YOLO-PEST模型:突破水稻害虫检测中的遮挡与小目标难题 中文标题 YOLO-PEST:基于YOLOv5s的水稻害虫检测新方法及其在复杂田间环境中的应用

【字体: 时间:2025年09月27日 来源:Plant Methods 4.4

编辑推荐:

  针对水稻害虫检测中存在的样本多样性不足、目标遮挡及小目标识别精度低等问题,研究人员开展了基于YOLOv5s架构的YOLO-PEST模型研究。通过随机裁剪生成遮挡样本模拟真实场景,引入ConvNeXt模块增强多尺度特征提取能力,并结合CoTAttention机制抑制复杂背景干扰。实验结果表明,该模型mAP@0.5达到97%,较基线提升1.4个百分点,为智能农业害虫精准监测提供了有效解决方案。

  
在水稻种植过程中,害虫持续威胁着成熟作物,导致产量和品质下降。传统人工检测方法不仅劳动强度大、主观性强,还容易因误判导致农药过度使用,造成环境污染。虽然深度学习技术在农业领域展现出巨大潜力,但在实际田间应用中仍面临两大核心瓶颈:一是茎叶重叠、生物活动及光影造成的害虫遮挡问题降低了检测可靠性;二是小尺寸害虫的特征表达不足制约了检测精度。现有的害虫检测方法如Maize-YOLO、YOLO-RMD等虽取得一定进展,但在处理复杂遮挡环境和小目标时仍存在性能衰减或泛化能力不足的问题。
针对这些挑战,安徽工程大学计算机与信息学院的强军教授团队在《Plant Methods》发表了题为"YOLO-PEST: a novel rice pest detection approach based on YOLOv5s"的研究论文。该研究以YOLOv5s为基础框架,通过创新性的遮挡训练方法和网络结构优化,显著提升了水稻害虫在复杂环境下的检测性能。
研究人员采用了几项关键技术方法:首先通过多渠道收集水稻害虫图像构建专用数据集,采用随机裁剪方式模拟真实遮挡场景;其次在特征融合过程中引入ConvNeXt模块改进多尺度特征提取能力;同时集成CoTAttention机制增强模型在复杂环境下的鲁棒性。实验使用包含10类害虫、2,000张原始图像的数据集,经过遮挡增强后训练集扩展至8,336张图像。
数据集构建与增强
研究团队通过手动筛选和标注构建了包含10类危害性水稻害虫的数据集,使用LabelImg工具进行矩形边界框和类别标注。为解决样本不平衡问题,对标签3、4、9类害虫采用水平翻转、亮度对比度调整和随机旋转进行数据增强,使训练集最终包含2,084张图像和2,886个标注框。
遮挡训练策略
为模拟田间茎叶重叠、生物活动和光影造成的遮挡问题,研究提出了基于部分遮挡的数据增强方法。该方法读取YOLO格式标注文件获取边界框信息,通过确定四个方向(上、下、左、右)的遮挡区域(宽度或高度设置为边界框的1/4),从同一图像中随机裁剪相同大小的图像块覆盖到对应区域,生成4个新图像。这种方法既保持了图像局部的自然性,又有效提升了模型在真实遮挡场景下的泛化能力。
网络结构优化
研究在YOLOv5s的Neck部分使用ConvNeXt模块替代原有的C3模块。该模块采用深度可分离卷积(DWConv)和逐点卷积相结合的方式,将DWConv的卷积核从3×3增大到7×7,通过反向瓶颈设计和层归一化稳定训练过程,有效减少类似特征提取任务中的冗余计算操作,提升小目标害虫的特征提取能力。
注意力机制集成
为解决复杂田间环境下背景杂乱、图像分辨率低的问题,研究在SPPF层前加入了CoTAttention(Contextual Transformer Attention)机制。该机制通过k×k分组卷积获取具有局部上下文信息的表示,然后通过concat操作和连续两个1×1卷积过程生成注意力矩阵,最终输出静态和动态上下文表达的综合集成,增强模型对害虫特征的辨别能力。
实验结果表明,YOLO-PEST模型在测试数据集上达到了97%的mAP@0.5和65%的mAP@0.5:0.95,较原始YOLOv5s分别提升1.4和2.6个百分点。与YOLOv7-tiny、YOLOv8s、YOLOv10s、YOLOv11s和YOLOv12s等主流模型相比,mAP@0.5分别高出15.9%、11.1%、6.2%、4.9%和4.2%。消融实验进一步证实了各改进模块的有效性:单独使用CoTAttention模块使mAP@0.5提高0.5%,单独使用ConvNeXt模块提高0.9%,而两者结合实现了1.4%的性能提升。
检测结果可视化显示,即使在害虫被遮挡、不完整或多个目标聚集的情况下,模型仍能准确识别害虫种类,平均置信度达到约90%,验证了模型在实际应用中的有效性。
该研究的创新性在于提出了针对田间自然遮挡的模拟方法,通过使用同一图像的茎叶片段进行遮挡,既保持了稻田场景的一致性,又覆盖了田间环境中的主要遮挡类型。同时通过ConvNeXt模块增强小目标特征提取能力,结合CoTAttention机制强化复杂背景下的特征判别,为水稻害虫智能监测提供了一种新颖有效的解决方案。
研究人员也指出了研究的局限性:数据集中缺乏极端环境(如暴雨后的水渍、强逆光下的阴影干扰)样本;当前遮挡模拟主要关注茎叶重叠,尚未包含露水附着、虫粪覆盖等其他田间遮挡类型;模型推理速度仍需进一步提升以适应无人机巡检需求。未来工作将补充特殊气候条件下的样本,完善遮挡类型覆盖,并优化模型轻量化设计,推动YOLO-PEST与无人机等智能农业技术集成,实现实时害虫监测与管理。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号