YOLO-PLNet:一种基于边缘计算的轻量级实时检测模型,用于花生叶病害的识别
《Frontiers in Plant Science》:YOLO-PLNet: a lightweight real-time detection model for peanut leaf diseases based on edge deployment
【字体:
大
中
小
】
时间:2025年11月19日
来源:Frontiers in Plant Science 4.8
编辑推荐:
针对花生叶 disease 实时检测中轻量级模型存在的效率与准确率平衡问题,本文提出YOLO-PLNet模型,通过引入LAE模块、CBAM模块和AFPN模块优化特征提取与融合,在保持高检测准确率(mAP@0.5达98.1%)的同时显著降低参数数量(2.13M)和计算复杂度(5.4G),并验证其在Jetson Orin NX边缘设备上的实时性能(INT8精度下41.3 FPS)。
花生作为一种重要的经济作物,其生长过程中经常受到叶部病害的威胁,这不仅影响产量,还严重降低品质。因此,实现早期和准确的病害检测成为农业智能化发展的关键环节。然而,现有的轻量化深度学习方法在模型体积、实时检测精度以及边缘设备部署之间往往难以取得良好的平衡,这在大规模农业应用场景中限制了其广泛应用。本文提出了一种名为YOLO-PLNet的轻量化实时检测模型,专门设计用于边缘设备的部署。该模型基于YOLO11n,并对主干网络和颈部结构进行了轻量化改进。引入了轻量级注意力增强(LAE)卷积模块,以减少计算负担,同时结合通道-空间注意力机制(CBAM)来增强对小病斑和边缘模糊目标的特征表示能力。此外,检测头采用了渐进式特征金字塔网络(AFPN),利用跨层融合策略,提高多尺度检测性能。这些改进显著提升了花生叶部病害在复杂背景下的检测精度,并增强了模型在边缘设备部署中的适应性。实验结果表明,YOLO-PLNet的参数数量、计算复杂度和模型大小分别为2.13M、5.4G和4.51MB,分别比基线YOLO11n减少了18.07%、16.92%和15.70%。在mAP@0.5和mAP@0.5:0.95指标上,YOLO-PLNet分别达到98.1%和94.7%,比YOLO11n提升了1.4%和1.7%。当在Jetson Orin NX平台部署,并使用CSI摄像头进行实时视频输入时,模型在FP16精度下实现了19.1毫秒的延迟和28.2帧每秒(FPS)的检测速度。在INT8精度下,延迟进一步降低至11.8毫秒,检测速度提升至41.3 FPS,同时显著降低了GPU使用和能耗,仅轻微影响检测精度。综上所述,YOLO-PLNet在高检测精度和强大的边缘部署性能方面表现出色,为花生叶部病害的智能监测提供了一种高效且可行的解决方案。
在现代农业的发展背景下,基于计算机视觉的植物病害检测技术已成为主流解决方案,因其具备非接触、自动化和高效率等优势。研究人员广泛探索了深度学习模型在作物病害识别中的应用。例如,Miao等人提出了SerpensGate-YOLOv8模型,该模型结合了DySnakeConv、SPPELAN和STA注意力机制,在公开的PlantDoc数据集上达到了71.9%的精度。类似地,Ayon等人对四种深度学习模型(VGG16、ViT、EfficientNetB3和Xception)在茶树图像数据集上进行了系统比较,验证了Transformer架构和传统卷积神经网络(CNN)在茶树病害识别中的有效性。然而,这些模型通常依赖于高性能服务器或桌面级GPU平台,这使得它们在资源受限的嵌入式边缘设备上难以稳定运行。在花生种植场景中,病害分布广泛且密集,单帧图像检测无法全面覆盖连续区域。因此,使用低功耗、紧凑型边缘AI设备进行实时视频检测成为一种有前景的发展方向。通过在边缘平台(如Jetson Orin NX和Jetson Orin Nano)上进行推理,可以在田间实现实时检测,从而显著降低上行带宽和传输延迟,确保在弱网络条件下也能实现连续监测。此外,这些设备可以与无人机和自主农业机械协同工作,降低人工成本并提高农药施用或灌溉的效率。
为解决上述挑战,研究人员越来越多地关注设计轻量级网络架构,如YOLO、MobileNet、ShuffleNet和EfficientNet,以实现深度学习病害检测模型在边缘AI设备上的高效部署。Zhang等人提出了GVC-YOLO模型,专门用于在边缘设备上进行棉花蚜虫叶部病害的实时检测。该模型基于YOLOv8n,集成了GSConv、VoVGSCSP、SimSPPF和坐标注意力机制,实现了48 FPS的实时推理速度,同时保持了97.9%的检测精度,模型大小仅为5.4 MB。同样,Xie等人引入了YOLOv5s-BiPCNeXt模型,该模型结合了MobileNeXt主干网络、C3-BiPC结构、EMA注意力机制和CARAFE上采样操作,实现了在Jetson Orin Nano上的26 FPS的高效检测,有效平衡了部署效率和识别性能。此外,一篇综述系统地总结了边缘AI和物联网在实时作物病害检测中的关键技术,将其分为四类:边缘感知和处理框架、轻量级模型、数据驱动方法以及针对农业场景的通信协议。该综述强调了基于MobileNet/EfficientNet的CNN,结合剪枝和量化等技术,已经在Raspberry Pi和Jetson Nano等硬件上实现了有效的病害检测。
在这些研究的基础上,我们开发了一种高效的花生叶部病害检测模型YOLO-PLNet,并将其部署在Jetson Orin NX边缘设备上。基于YOLO11n,我们集成了轻量级注意力增强卷积模块,以提升模型对边缘细节和目标区域的感知能力。此外,我们利用渐进式跨层融合的Asymptotic Feature Pyramid Network(AFPN)来改善检测性能。在部署阶段,我们采用TensorRT进行精度优化和推理加速,将模型部署在配备工业级CSI摄像头的Jetson Orin NX边缘平台上。通过使用田间捕捉的视频流进行实时检测,并在FP16、INT8和多分辨率设置下对模型的延迟、帧率、内存使用和功耗进行了系统评估。总体而言,本研究为花生叶部病害的精确识别和智能管理提供了一个可行的技术方案。
为了实现花生叶部病害的精确检测与识别,我们构建了一个包含六个主要病害类别的新型花生叶部病害数据集。该数据集不仅提升了覆盖范围,还增强了样本的代表性,为模型训练提供了更丰富、更均衡的样本集。数据采集工作在2024年6月下旬至9月中旬期间,覆盖了河南省郑州市超过20个代表性花生田,涵盖了主要叶部病害在花生生长周期中的典型病害阶段。图像数据主要使用Fuji FinePix S4500数码相机拍摄,分辨率为2017×2155像素,保存为JPG格式。相机与叶片之间的距离控制在20-35厘米之间,图像采集主要在7:00 AM、1:00 PM和5:00 PM三个时间段进行,以模拟自然环境中的不同光照条件。在数据采集过程中,充分考虑了各种拍摄角度(包括平视、俯视和侧视)以及多样化的自然光照条件(如晴天、阴天和逆光场景),以捕捉典型的田间场景特征。该数据集涵盖了病害从初期到严重发展的所有阶段,包括早期叶斑病、早期锈病、晚期叶斑病、晚期锈病、营养不良和健康叶片六大类别。通过严格的图像质量筛选,保留了2,132张高质量的原始图像样本,为后续的模型训练和评估提供了坚实的数据基础。数据集的分类标准详见表1,花生叶部病害数据集的示例图像详见图1。
为了实现花生叶部病害的准确检测和识别,我们邀请植物保护专家指导,使用LabelImg工具对采集的图像进行手动标注。标注基于每个目标的最小包围矩形,确保包围框紧密贴合病害区域,以减少背景干扰,从而提高后续模型的定位精度。考虑到原始图像数量有限以及田间环境的复杂性和多变性,直接使用原始数据进行训练可能导致过拟合,难以推广到更广泛的应用场景。为了增强模型的鲁棒性和泛化能力,我们对2,132张标注图像进行了多种数据增强处理,包括水平和垂直翻转(概率为50%)、90度旋转(随机选择无旋转、顺时针旋转、逆时针旋转或垂直翻转)、亮度和对比度扰动(随机调整原始亮度±5%至10%)以及随机裁剪(在水平和垂直方向上随机裁剪,角度范围为-15°至+15°)。这些增强技术有效模拟了不同姿态、光照条件和遮挡下的目标外观,增加了训练样本的多样性。增强后的图像总数达到7,363张。随后,我们将数据集划分为训练、验证和测试集,比例为8:1:1,并采用分层随机抽样策略,以确保各类别分布的一致性和代表性。增强后的数据集详情见表2。
YOLO11模型(Khanam和Hussain,2024)是Ultralytics团队于2024年推出的另一项重大突破,特别是在架构设计和性能优化方面。YOLO11继承了YOLO系列端到端、单阶段检测框架的优势,同时集成了多种创新的结构模块,实现了检测精度、推理速度和部署灵活性之间的优越平衡。根据网络深度和模型复杂度,YOLO11提供了五个变体:N、S、L、M和X,以适应从资源受限的边缘设备到高性能计算平台的各种应用需求。为了评估这些变体在性能-效率权衡方面的表现,我们比较了关键指标,包括参数数量、mAP@50–95精度、ONNX CPU和T4 TensorRT推理延迟以及FLOPs,详见表3。
如表3所示,YOLO11n变体在合理检测精度(39.5% mAP)下实现了最低的参数数量(2.6M)和计算复杂度(6.5G FLOPs),相比最大的X变体,参数数量减少了约24倍,计算复杂度降低了超过30倍。这种效率优势使其成为资源受限场景的理想基线模型。YOLO11的这一效率优势源于其在特征表示和计算效率方面的多项关键架构改进。首先,预测头采用了优化的C3k2模块,取代了传统的C2f结构。该模块使用两个较小的卷积核,而不是一个大的卷积核,从而降低了计算负担和参数数量,同时允许在轻量级C2f和更深层次的C3结构之间灵活切换,以满足不同的建模需求。其次,保留了空间金字塔池化快速(SPPF)模块,以增强感受野,并引入了新的C2PSA(通道到像素空间注意力)机制,以聚焦于关键空间区域,从而提高对小目标和遮挡目标的检测性能。最后,检测头采用了深度可分离卷积(DWConv),以减少计算复杂度,使其更适合资源受限环境下的部署。
为了实现高效部署,我们在YOLO11n的基础上进行了轻量化改进。首先,使用了轻量级自适应特征提取(LAE)模块,以替换主干网络和颈部网络中的某些标准卷积操作。该模块通过低计算复杂度实现多尺度特征融合,增强了模型对病害斑点区域的感知能力。其次,我们在YOLO-PLNet的颈部网络中嵌入了卷积块注意力模块(CBAM),该模块通过通道和空间注意力机制,进一步增强了关键区域的特征响应能力,提高了高分辨率特征图对小病斑和边缘模糊目标的表示能力。此外,检测头被替换为渐进式特征金字塔网络(AFPN),该网络通过分阶段的跨层融合策略,有效缓解了传统特征金字塔网络(FPN)在不同尺度特征直接融合时可能引发的语义差异问题。AFPN从相邻的浅层特征(如C2和C3)开始,逐步引入更高层的语义特征(如C4和C5),使跨层信息在逐层注入的同时保持语义连续性。AFPN在相邻特征之间引入了横向连接和跨尺度融合路径,使得低层细节和高层语义能够以渐进的方式对齐和协作。该模块的结构详见图3。
为了满足田间花生叶部病害实时检测的需求,以及低延迟和低功耗的要求,本研究选择了NVIDIA Jetson Orin NX作为边缘部署平台。该设备集成了1,024个CUDA核心和32个Tensor Core,以INT8精度实现了高达100 TOPS的AI推理性能。它能够高效地在本地运行深度神经网络,避免网络传输带来的延迟和不稳定。此外,Jetson Orin NX支持通过JetPack SDK开发端到端加速的AI应用,便于模型优化、部署和现场集成。如图7所示,该平台具备小型化、高性能和低功耗等优势,适用于农业机器人和植物保护无人机等边缘设备。这有助于实现现场定位和快速响应花生病斑。Jetson Orin NX的详细硬件参数详见表4。
为了确保模型训练的公平性和可重复性,所有实验均在统一的实验室服务器上进行。服务器运行于Ubuntu 20.04 LTS操作系统,配置包括16核Intel(R) Xeon(R) Platinum 8352V CPU @ 2.10GHz、120GB内存和NVIDIA GeForce RTX 4090(24GB VRAM)。软件环境由Python 3.8 + PyTorch 1.11组成,集成CUDA 11.3和cuDNN加速库以提高GPU推理效率。所有模型均使用一致的超参数设置进行训练,以确保结果的可比性,训练参数配置详见表5。
为了全面评估模型在目标检测任务中的性能,我们使用了多种评估指标,包括精确率(Precision)、召回率(Recall)和平均精度(mAP)。其中,mAP是衡量检测精度的关键指标,广泛用于评估模型在不同交并比(IoU)阈值下的识别能力。为了评估模型在不同检测条件下的鲁棒性和泛化能力,我们引入了两个额外的指标:mAP@0.5和mAP@0.5:0.95。mAP@0.5表示在IoU阈值为0.5时的平均检测精度,主要衡量模型的基本检测能力。mAP@0.5:0.95则计算在IoU阈值从0.5到0.95(步长为0.05)范围内的平均精度,提供了对模型在多尺度和多类别场景下的检测稳定性与泛化性能的更全面反映。相关评估指标的计算公式详见公式8-11。
通过实验,我们发现YOLO-PLNet在检测精度和推理速度方面均优于基线模型YOLO11n。该模型的改进主要归功于对主干网络和颈部网络的轻量化优化。通过引入LAE模块,该模型在不同尺度和空间分布的目标特征上提升了特征响应能力,使其在处理病害斑点分布不均和边界模糊的病害时仍能保持稳健的感知能力。此外,CBAM注意力机制在特征融合路径中的集成,有效抑制了复杂田间背景中的非目标干扰,如水渍和反光点,进一步增强了模型对病害区域的聚焦分布和表示稳定性。AFPN的跨尺度信息融合策略通过自适应加权,实现了对多尺度特征的动态融合,提升了模型对不同尺度病害目标的检测能力,尤其是对小尺度斑点的检测,同时有效抑制了低质量特征的干扰,保持了较低的计算负担。当所有三个模块(LAE、CBAM和AFPN)同时集成时,YOLO-PLNet在保持高检测精度的同时,有效减少了模型参数数量和权重大小,为花生叶部病害的高效检测和边缘设备部署提供了有力支持。
为了验证YOLO-PLNet在边缘设备上的部署适应性和实时推理能力,我们构建了一个完整的推理流程,涵盖真实的花生田场景,如图12所示。该流程基于Jetson Orin NX开发套件(图7),该套件作为硬件基础。在平台上,训练好的YOLO-PLNet模型首先从.pt格式转换为ONNX中间表示,然后通过TensorRT工具链优化为.engine推理引擎文件。为了模拟田间动态监测需求,引入了工业级CSI(Camera Serial Interface)摄像头,该摄像头能够捕捉包含自然光照变化和叶片运动干扰的真实视频流。通过TensorRT运行时加载.engine文件,并结合摄像头输入的实时视频流,进行逐帧推理和可视化,验证了模型在动态和复杂边缘场景下的部署性能。
为了验证模型在边缘设备上的推理效率,本研究基于图12所示的边缘部署推理流程,使用主流推理框架TensorRT进行实验。TensorRT提供了多种精度优化方法,包括FP16半精度和INT8整数量化部署模式。FP16精度使用半精度浮点表示,具有计算速度快和内存使用低的优势,广泛应用于边缘设备上的高效推理场景。相比之下,INT8精度将权重和激活值量化为8位整数,使模型大小和设备功耗进一步降低,同时保持一定的精度,这与资源受限的边缘设备需求高度契合。在完成模型训练后,我们使用TensorRT提供的后训练量化(PTQ)工具链,将原始ONNX模型(FP32精度)直接转换为FP16和INT8精度版本,避免了重新训练的高昂成本。随后,将这些版本部署在Jetson Orin NX平台上,以验证不同量化策略对部署性能的影响,详细结果见表9。
实验结果表明,在不同的量化精度下,模型的检测精度差异较小,而推理效率和资源利用率的提升显著。INT8量化模型相比FP16精度,在推理延迟上减少了38.21%,帧率提高了46.45%,同时显著降低了内存使用和功耗,虽然检测精度略有下降至97.5%。这使得模型能够在低功耗的嵌入式平台上实现高效的实时病害检测。尽管INT8量化导致了轻微的精度下降,但其在功耗和速度上的显著提升对于电池供电的移动平台(如农业无人机和巡检机器人)至关重要。这种效率得到了Jetson Orin NX在INT8精度下约100 TOPS性能的支持,使其能够在田间连续运行,满足农业中对可持续边缘AI的日益增长的需求。
尽管本研究构建了一个高质量的花生叶部病害数据集,并开发了一种专门针对边缘设备的轻量级检测模型,但仍存在一些局限性。首先,模型的泛化能力仍需进一步提升。其性能尚未在不同区域的花生品种、未知病害类型或跨作物场景(如玉米、大豆)中得到充分验证,这可能限制其在多样化农业环境中的适应性。其次,存在数据隐私和商业保密方面的潜在风险。当前的集中式训练方法在多个农场部署时,可能导致敏感的农业信息(如种植布局和品种特征)泄露,带来伦理和安全方面的担忧。
为了解决这些局限性,未来的研究可以朝着以下几个方向展开:首先,为了提高跨场景的适应性,应探索更先进的技术,如域适应和开放集识别,以增强模型对不同作物、未知病害和复杂田间条件的兼容性。其次,应开发一种保护隐私的协同训练框架,利用联邦学习技术,使多个农场能够分布式训练,整合多源农场数据进行迭代优化。这不仅有助于提升模型的泛化能力,还能有效保护数据隐私,确保农业信息的安全性。
综上所述,本研究提出了一种用于花生叶部病害的轻量级目标检测模型YOLO-PLNet,专为边缘部署设计。该模型基于YOLOv11,结合了LAE、CBAM和AFPN等结构改进,以增强特征表示能力和检测精度。研究的主要结论如下:
1. YOLO-PLNet模型在花生病害数据集上实现了98.1%的mAP@0.5和94.7%的mAP@0.5:0.95。相比基线模型YOLOv11n,其参数数量、FLOPs和模型大小分别减少了18.07%、16.92%和15.70%,实现了模型轻量化,为边缘部署提供了有利条件。
2. 在Jetson Orin NX边缘设备上部署,YOLO-PLNet在INT8精度下的推理延迟相比FP16精度减少了38.21%,帧率提高了46.45%,显著降低了内存使用和功耗,虽然检测精度略有下降至97.5%。这使得模型能够在低功耗的嵌入式平台上实现高效的实时病害检测。
3. 在多分辨率输入下,640×640分辨率在边缘设备上实现了最佳的推理效果,适合农田场景中的中等分辨率图像流。结合CSI摄像头的视频输入,该模型实现了端到端的自动检测和可视化反馈。
总之,所提出的YOLO-PLNet模型在高精度、低资源消耗和良好的工程部署性方面表现出色,适用于农业边缘智能终端上的花生叶部病害监测任务。在可持续农业发展的背景下,该模型能够为农民提供精确的病害预警信息,实现有针对性的病害管理,减少不必要的农药使用,推动绿色农业的发展。未来的研究可以将该模型与物联网传感器集成,以进一步提升其在实际农业场景中的实时性能和适应性,促进农业自动化和智能化管理的广泛应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号