一种高精度的农业害虫检测模型,通过距离池化和位置校正技术得到了进一步提升

《Journal of Stored Products Research》:A high-accuracy model for agricultural pest detection enhanced with distance pooling and location correction

【字体: 时间:2025年10月02日 来源:Journal of Stored Products Research 2.8

编辑推荐:

  农业害虫实时检测中,针对传统方法多样性不足、轻量YOLOv8n模型精度受限等问题,提出改进的YOLO-PE模型。通过DisPool模块增强多尺度特征提取,采用DySample优化上采样过程,并新增NMS后位置校正机制,在保持3.25M小参数量的同时,mAP@0.5提升4.5%至83.8%,推理速度达110FPS。

  农业害虫的准确识别对于保障作物健康、提高产量具有重要意义。然而,传统方法在面对害虫种类繁多、光照不足以及背景复杂等问题时,往往难以达到理想的识别精度和适应性。特别是在实际应用中,要求系统具备实时性,这使得现有技术面临一定的挑战。为了解决这些问题,本文提出了一种改进的轻量级目标检测模型——YOLO-PE。该模型基于最新的YOLOv8n网络结构,通过引入一系列优化策略,实现了更高的检测精度和更高效的模型运行。

农业作物,如小麦、水稻和玉米,是全球粮食供应的主要来源,满足了数十亿人口的基本营养需求。害虫造成的损害是导致作物减产和农业经济损失的主要因素之一。据相关研究显示,全球因害虫造成的作物损失占总产量的50%至80%。害虫和杂草的侵害对全球农业生产产生了巨大影响,占总产出的20%至30%。因此,这种问题每年导致约700亿美元的经济损失。在中国,每年因害虫和病害造成的粮食损失约为1400万吨。由此可见,害虫的检测与控制在农业领域一直是备受关注的热点问题。

及时的害虫防治措施可以有效降低经济损失,但农业害虫的多样性以及某些害虫外观的高度相似性,使得非专业人员在识别时面临巨大挑战。虽然具有专业知识的昆虫学家可以显著减少误分类,但这种方法成本高、效率低。随着机器学习的发展以及害虫数据集的不断扩展,一种具有前景的害虫识别方案逐渐受到关注。例如,Ebrahimi等人(2017)利用支持向量机(SVM)分类方法检测作物冠层图像中的蓟马。他们通过设计基于图像特征的区域和颜色指标,实现了最佳分类效果,平均误差率低于2.25%。Loti等人(2020)则使用了六种传统图像处理方法,如颜色直方图、LBP和SIFT,以及六种深度学习方法,如VGG16,进行辣椒叶片图像的特征提取。他们将这些特征输入到三个分类器(SVM、RF、ANN)中进行分类,结果显示深度学习方法的特征提取效果优于传统方法,分别达到了92.10%、83.68%和89.84%。尽管这些传统图像处理技术提高了效率并缓解了专家短缺的问题,但它们仍然依赖专家经验和复杂的参数调整,且往往针对特定场景进行优化,限制了其通用性和鲁棒性,尤其是在处理复杂数据集和大规模应用时。

近年来,以卷积神经网络为代表的深度学习模型在害虫检测领域取得了显著进展。相比传统方法,这些模型能够自动从图像数据中学习并提取害虫的关键特征,即使在害虫被遮挡、重叠或处于复杂背景的情况下,也能实现较高的定位精度。它们具有更强的鲁棒性和更好的泛化能力,逐渐在实际应用中取代了传统方法。当前的目标检测算法主要分为两类:一类是基于Faster R-CNN的两阶段算法,另一类是基于YOLO的单阶段算法。两阶段算法首先在图像上生成可能包含目标的局部区域,然后判断这些区域是否包含目标及其类别,最后调整候选区域以更精确地匹配目标。其检测精度通常较高,但速度较慢且计算量较大。而单阶段算法则直接在均匀分布的锚点上生成目标预测信息,因此具有更强的实时性。

在农业害虫检测的应用中,YOLO算法被广泛采用。例如,Tang等人(2021)提出了基于YOLOv4的实时害虫检测方法(Pest-YOLO)。该方法在主干网络中引入了SE注意力机制,以增强特征提取能力,并在FPN的最低和最高层添加了跨阶段融合路径,以强化害虫特征的表达。这种方法实现了71.6%的mAP和83.5%的召回率。然而,由于其基准速度为70 FPS,实际检测速度仅为76 FPS,且参数量高达48.64 M,使得该模型在资源受限的部署环境中仍不适用。Zhang等人(2022)提出了一种轻量级害虫检测算法(AgriPest-YOLO),用于检测25种害虫类别。他们引入了协调与局部注意力(CLA)机制,以减少图像中的噪声干扰,并在后处理阶段使用了Soft-NMS优化重叠的预测框。该模型的mAP达到了71.3%,优于其他经典模型。检测速度(8.8 ms)和参数量(15.1 M)也达到了较为理想的效果。然而,由于害虫图像的背景是人工设定的,该模型可能不适用于自然环境中的害虫检测。Qiang等人(2023)提出了一种基于VGG16和SSD的双主干网络检测算法,用于检测柑橘叶片上难以识别的害虫。该算法在室内数据集上的mAP达到了72.54%,而在另一组植物背景数据集上的mAP则达到了86.01%。然而,该模型的实时性仅为52 FPS,且检测类别仅限于七种和两种,限制了其适用范围。可视化结果也显示,该模型在边界框的拟合上仍有提升空间。Cen等人(2025)提出了基于YOLOv8架构的轻量级模型YOLO-LCE。他们使用了高效的局部卷积(EPConv)作为下采样操作,并引入了带有局部卷积的幽灵模块,以减少检测头的计算负担。该模型将参数量从3.01 M减少到1.69 M,GFLOPs减少了33.3%,实现了先进的轻量化效果。然而,其mAP仅提高了0.5%,达到63.9%的总体基础检测性能。Tian等人(2023)提出了新的MD-YOLO模型,该模型在631张增强图像上进行训练,用于检测三种鳞翅目害虫。该模型在YOLO架构中集成了DenseNet模块和自适应注意力模块,以增强特征利用。实验结果显示,该模型的mAP达到了86.2%,但其参数量高达126.8 MB,且边界框的回归精度仍低于主流YOLOv8模型。Lu等人(2025)引入了轻量级深度可分离卷积(SD-Conv)、增强多尺度能力的LDSPF模块、提高特征区分度的MDF模块以及提升特征表达的ASCC模块,形成了创新的MA-YOLO架构。虽然该模型在参数量和检测速度方面有所提升,且在多个数据集上实现了精度的提高,但其提升幅度仅为2%和1.8%,仍有进一步优化的空间。同时,集成多种优化策略也增加了模型的部署复杂度。

尽管近年来农业害虫检测的研究取得了持续进展,但基于大规模数据集的害虫识别仍面临诸多挑战。首先,网络模型的参数量较大,导致在边缘设备上的部署效果不佳。因此,迫切需要开发轻量级模型,以降低系统复杂度和维护成本,同时避免性能过度下降,保持较高的运行速度。其次,最新提出的模型在识别精度方面仍然相对较低,这可能是由于同一类别内的个体差异以及不同类别之间的特征相似性,使得模型难以有效提取特征。第三,部分数据集中的害虫具有较长的触角和腿部,使得模型难以回归完全符合真实值的边界框。此外,在自然环境中采集的害虫图像通常具有复杂的背景,这限制了特征的提取效果。

为了解决上述挑战并克服农业害虫检测中的固有困难,本文进行了有针对性的处理。首先,我们强调模型的轻量化和高效性,因此选择改进最新SOTA(state-of-the-art)模型YOLOv8n的轻量级变体,并将其命名为YOLO-PE。其次,我们关注害虫的细粒度分类,这需要更精细的特征提取和更深层次、更密集的网络结构。为此,我们用距离池化模块替代了原来的C2f模块。该模块是一个轻量级的DenseNet模块,嵌入了池化操作。DenseNet框架用于更高效和全面地提取特征,而池化操作则负责在减少特征冗余的同时,保持多尺度性能。第三,我们关注算法的推理能力。在后处理阶段的非最大值抑制(NMS)之后,我们添加了一个位置校正步骤,以重新利用被丢弃的预测框信息,并校正输出边界框的位置。

此外,为了避免在FPN阶段信息融合过程中由于直接上采样导致的信息丢失问题,我们采用了超轻量级且高效的动态采样器DySample。该方法旨在保留细节的同时减少卷积操作的使用,从而避免引入过多的计算负载和参数量。

本文的研究对象是常见的农业害虫,数据集来源于公开的IP102数据集(Wu等人,2019),该数据集包括两种作物:田间作物和经济作物。具体而言,田间作物包括水稻、玉米和小麦,而经济作物包括甜菜、苜蓿、葡萄、柑橘和芒果。该数据集包含75,222张图像,涵盖102种害虫物种。其中,约有18,983张图像用于测试和验证。通过该数据集,我们能够更全面地评估模型在不同场景下的性能,包括复杂背景和自然光照条件下的检测效果。

为了验证本文提出的三种改进模块(距离池化模块、DySample上采样和位置校正)的效果,我们设计并进行了系列消融实验。考虑到位置校正是一种后处理改进,因此未将其单独与前两个网络修改模块进行结合以展示效果。实验结果表明,距离池化模块在特征提取方面具有显著优势,能够有效提升模型的检测精度。同时,DySample的引入使得模型在保持高效的同时,减少了信息丢失,提高了上采样的准确性。位置校正步骤则进一步优化了边界框的定位,使得检测结果更加精确。

在实验过程中,我们还发现,传统方法在某些特定场景下仍然具有一定的优势,例如在数据量较小或计算资源有限的情况下。然而,随着农业害虫检测需求的增加,特别是在大规模应用和复杂数据集的背景下,传统方法的局限性愈发明显。因此,本文提出的YOLO-PE模型在保持轻量化的同时,实现了更高的检测精度,为农业害虫检测提供了更加高效和可靠的技术方案。

此外,本文还探讨了不同模型在农业害虫检测中的适用性。例如,AgriPest-YOLO在检测速度和参数量方面表现出色,但在自然环境下的适用性有限。而MD-YOLO虽然在检测精度方面有所提升,但其参数量较大,限制了其在边缘设备上的部署。因此,YOLO-PE模型在兼顾轻量化、检测精度和实时性方面具有独特优势,能够更好地适应农业害虫检测的实际需求。

在实际应用中,YOLO-PE模型不仅能够提高害虫检测的准确性,还能减少系统的复杂性和维护成本。这使得该模型在农业智能化和自动化系统中具有较高的实用价值。例如,在农业无人机、智能监控系统和自动化农业设备中,YOLO-PE能够提供高效的害虫检测服务,帮助农民及时采取防治措施,减少作物损失。同时,该模型的轻量化特性也使其在边缘设备上的部署更加可行,为农业害虫检测的广泛应用提供了技术支持。

在技术实现方面,YOLO-PE模型在主干网络中引入了距离池化模块,以增强特征提取能力。该模块通过池化操作减少特征冗余,同时保持多尺度性能,使得模型在不同大小的害虫检测任务中均能保持较高的精度。在颈部网络中,我们采用了超轻量级的DySample上采样方法,以减少信息丢失并提高上采样的准确性。此外,在后处理阶段,我们添加了位置校正步骤,以重新利用被丢弃的预测框信息,并优化输出边界框的定位。这些改进使得YOLO-PE模型在保持高效的同时,实现了更高的检测精度。

在实验结果方面,YOLO-PE模型在多个数据集上的表现均优于其他经典模型。例如,在测试数据集上的mAP@0.5和mAP@0.5:0.95分别提高了4.5%和4.3%,达到了最高的mAP成绩83.8%。同时,模型的参数量仅为3.25 M,推理速度达到了110 FPS,实现了最佳的总体检测性能。这些结果表明,YOLO-PE模型在农业害虫检测中具有较高的实用价值和推广前景。

在研究过程中,我们还发现,不同害虫的特征差异较大,这使得模型在识别时需要具备更强的泛化能力。例如,某些害虫在不同生命阶段的形态差异显著,而不同类别之间的特征相似性也较高,这增加了模型识别的难度。因此,本文提出的YOLO-PE模型在特征提取和分类能力方面进行了针对性优化,使得模型能够更好地适应这些复杂情况。

此外,我们还对模型的鲁棒性和适应性进行了评估。例如,在光照不足或背景复杂的情况下,YOLO-PE模型仍然能够保持较高的检测精度。这表明该模型在实际应用中具有较强的适应能力,能够应对各种环境条件下的害虫检测任务。同时,该模型的轻量化特性也使其在资源受限的部署环境中具有较高的可行性,为农业害虫检测的广泛应用提供了技术支持。

在模型优化过程中,我们还考虑了算法的可解释性和可视化效果。例如,通过可视化结果,我们能够更直观地观察模型在边界框拟合方面的表现。这有助于进一步优化模型的结构,提高检测精度。同时,模型的可解释性也使得其在农业领域的应用更加透明和可信,有助于提高农民和农业技术人员对模型的信任度。

综上所述,本文提出的YOLO-PE模型在农业害虫检测中具有显著优势。通过引入距离池化模块、DySample上采样和位置校正步骤,该模型在保持轻量化和高效性的同时,实现了更高的检测精度。实验结果表明,YOLO-PE模型在多个数据集上的表现均优于其他经典模型,达到了83.8%的最高mAP成绩。同时,模型的参数量仅为3.25 M,推理速度达到了110 FPS,实现了最佳的总体检测性能。该模型为农业害虫检测提供了更加高效和可靠的技术方案,有望在农业智能化和自动化系统中发挥重要作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号