轻量级频域-尺度融合与长程依赖感受野网络用于边缘设备上的茄子病害检测

《Smart Agricultural Technology》:Lightweight Frequency-Scale Fusion and Long-Range Dependent Receptive Field Networks for Eggplant Disease Detection on Edge Devices

【字体: 时间:2026年06月09日 来源:Smart Agricultural Technology 5.7

编辑推荐:

  植物病理威胁的及时识别对粮食安全至关重要,然而在资源受限的边缘设备上部署高保真检测模型仍因计算效率与特征表示之间的固有权衡而成为智慧农业中的重大瓶颈。本研究提出了LEAFDet,一种专为实时茄子病害监测设计的轻量级且鲁棒的检测框架。为支持此研究,研究人员系统构

  
植物病理威胁的及时识别对粮食安全至关重要,然而在资源受限的边缘设备上部署高保真检测模型仍因计算效率与特征表示之间的固有权衡而成为智慧农业中的重大瓶颈。本研究提出了LEAFDet,一种专为实时茄子病害监测设计的轻量级且鲁棒的检测框架。为支持此研究,研究人员系统构建了包含4,593张复杂田间图像的新数据集EDD-4K。具体而言,研究人员集成了动态卷积CSP瓶颈模块(Dynamic Convolutional CSP Bottleneck),该模块通过逐实例自适应重新校准权重大幅减少静态参数,确保高模型容量同时占用最小存储空间。为进一步优化计算流程,采用ADown模块在保持语义完整性的前提下加速特征下采样。关键的是,研究人员创新性地提出了频域感知大可分核注意力(Frequency-aware Large Separable Kernel Attention, FF-LSKA)方法,该方法协同融合局部纹理细节与长程空间依赖关系,显著增强了针对多变病斑形态的特征判别能力。基准实验表明,LEAFDet的AP50达到88.93%,AP50-95达到54.98%,显著优于现有最优架构。其纳米级变体在商业移动平台(骁龙8+ Gen 1)的CPU上维持115 FPS的推理速度,现场部署证实其在约23 FPS下稳定运行且无热降频,验证了该系统用于实时、无损病害监测的有效性。
**论文解读文章**

**研究背景与问题**
农业是人类文明和全球社会经济稳定的基石,但植物病害每年导致约35%的农业损失,全球范围内未受控制的病原暴发可危及高达70-80%的潜在产量。茄子(*Solanum melongena* L.)作为全球重要的经济蔬菜作物,极易遭受多种病害和虫害威胁,如果实腐烂、果实蛀虫和瓜蓟马等,这些病害可导致灾难性减产。传统诊断方法依赖专家现场目视检查,劳动强度大、时效性差,无法满足高通量、实时或无损监测的需求;早期数字图像处理方法虽有所进步,但鲁棒性不足。近年来,深度学习模型在农业病害检测中取得突破,但大多数研究在实验室GPU上评估性能,忽略了实际部署到资源受限边缘设备(如手机)时面临的功耗、热管理、计算吞吐量和内存容量等硬件约束。因此,如何在保证高检测精度的同时实现轻量化、低延迟的边缘端部署,是当前智慧农业面临的关键瓶颈。

**研究目标与贡献**
为突破上述瓶颈,研究人员提出LEAFDet——一种高保真、轻量化的茄子病害检测框架,旨在将服务器级诊断智能自主运行于边缘平台,同时满足严格的精度和能效要求。论文在《Smart Agricultural Technology》发表。具体贡献包括:构建了包含4,593张高分辨率图像的多源茄子病害数据集EDD-4K;设计了集成动态卷积CSP瓶颈(DCC3K2)、非对称下采样(ADown)和频域-尺度融合的轻量检测框架;创新性地提出频域感知大可分核注意力(FF-LSKA)模块,协同捕捉局部纹理与长程空间依赖;在多个基准数据集上进行严格评估;并在实际边缘设备上进行现场部署验证。

**主要关键技术方法**(不超过250字):
1. **动态卷积CSP瓶颈(DCC3K2)**:通过动态聚合多个专家核生成输入自适应卷积核,增加模型容量而不显著增加计算负载,避免“低FLOPs陷阱”。
2. **非对称下采样模块(ADown)**:采用双分支结构(可学习卷积路径和固定池化路径)解耦下采样与特征提取过程,最大化保留互补特征信息。
3. **频域感知特征融合(FF-LSKA)**:首先通过FreqFusion模块在频域解耦高/低频特征,再嵌入大可分核注意力(LSKA)高效建模长程空间依赖,形成协同融合机制。
4. **加权双向特征金字塔网络(BiFPN)**:引入带权重的双向跨尺度连接和重复堆叠,优化多尺度特征融合效率。
所有模型在统一平台上训练(RTX 4060Ti 16GB×2,i5-12600KF,PyTorch 2.4),超参数包括输入尺寸640×640、批次16、优化器AdamW、初始学习率1×10-3、余弦退火调度、300轮训练,并使用Mosaic等数据增强。数据集EDD-4K来源于Roboflow平台(~50%)、搜索引擎爬取(~20%)和广东省肇庆市实验农场实地采集(~30%,2024年7月24日,使用OnePlus Ace 2和Xiaomi 12手机),经过pHash去重、双盲标注等预处理,共4,593张图像,按7:2:1划分训练/验证/测试集。

**研究结果**

**3.1 K折交叉验证**:在EDD-4K上实施10折滚动交叉验证,LEAFDet-n的平均精度(P)为83.53%、召回(R)为77.27%、AP50为84.10%,优于基线YOLOv11n(AP50 82.11%)。AP50标准差仅0.99%,AP50-95标准差0.85%,双尾配对t检验p<0.01,证实模型具有强鲁棒性和泛化能力。

**3.2 与SOTA方法性能比较**:在EDD-4K测试集上,LEAFDet-m以16.7M参数、42.2 GFLOPs实现AP50-95 54.98%(+1.0% vs. DINO)和AP50 88.93%,推理速度60 FPS;LEAFDet-n以2.5M参数、5.71 GFLOPs实现115 FPS和AP50-95 51.66%,显著超越YOLOv8-n(48.72%)。分类别性能显示,LEAFDet在Melon Thrips类别上AP50-95提升5.60%(n变体),验证FF-LSKA在捕捉长程上下文和精细纹理方面的有效性。定性对比中,LEAFDet在密集聚类、遮挡和极端光照场景下均优于Faster-RCNN、YOLOv8n、RT-DETR等SOTA。

**3.3 消融实验**:
- **整体消融**:逐步集成ADown、DCC3K2、BiFPN、FreqFusion和FreqLSKA模块,完整配置(Group 13)达到最优折中:2.50M参数、5.71 GFLOPs、115 FPS、AP50 84.10%、AP50-95 51.66%。
- **注意力集成空间敏感性**:将FreqLSKA嵌入融合逻辑内部(即本文配置)比置于融合前(Pre)或后(Post)分别提升AP50 0.4%和1.34%。
- **有效感受野(ERF)动力学**:定量分析显示,最终模型在backbone-10层组的t=99%贡献面积达84.12%,较基线(76.84%)显著扩大,可视化表明其ERF分布更均匀宽广,证明该设计有效克服标准CNN的局部归纳偏置。
- **热力图对比**:Grad-CAM可视化表明LEAFDet能精准聚焦真实病斑区域,而基线易被非病源边缘区域误导,误报率升高。

**3.4 泛化能力与鲁棒性分析**:在EDD-4K、COCO2017和VisDrone2019三个异构基准上,LEAFDet均一致优于YOLOv11基线。在EDD-4K上AP50提升3.01%、AP50-95提升2.95%;在COCO复杂场景中置信度更高,对遮挡目标检测更稳定;在VisDrone密集小目标场景中有效抑制背景杂波,降低漏检。

**4. 边缘部署与应用验证**:通过ONNX→NCNN转换、FP16量化、异步流水线等步骤,在OnePlus Ace 2手机(骁龙8+ Gen 1)上部署。稳定推理阶段平均23.02 FPS(标准差σ=1.05),RAM占用107.12 MB,核心温度稳定在56.55°C无热降频。动态功耗约2.36W,净能效η约9.9 FPS/W,分布集中,表明系统处于稳定的“计算绑定”状态。现场验证显示,模型在强眩光、遮阴、枝叶遮挡等条件下均能保持高置信度检测,对微小目标(如点状果实腐烂)和密集目标均能精确定位。

**结论与讨论**
本研究建立的LEAFDet框架通过DCC3K2和FF-LSKA的协同,有效缓解了模型表示能力与边缘硬件资源限制之间的矛盾。核心科学发现是:增强有效感受野(ERF)相比于传统静态核缩放是识别形态不规则病理的更稳健范式——ERF贡献面积扩展至84.12%,使轻量卷积网络能够像重型Transformer架构一样捕捉长程依赖,同时保持低计算开销。LEAFDet在精度和效率之间建立了新的Pareto前沿,并在实际边缘设备上实现了稳定实时运行。本工作也识别出局限性:在极端“小-密”空中场景中,自适应锐化逻辑对高频噪声敏感,未来将优先改进小目标检测能力。通过弥合算法创新与硬件约束之间的鸿沟,本研究为自主作物生物安全监测提供了可扩展的基础。

**研究结论译文**:本研究建立了LEAFDet,一种高保真且计算高效的诊断框架,有效调和了模型表示能力与农业边缘硬件资源限制之间的长期矛盾。其核心进展在于策略性地集成了动态卷积CSP瓶颈(DCC3K2)和频域感知特征融合(FF-LSKA)模块。本研究的关键科学发现是:增强有效感受野(ERF)相比传统静态核缩放是识别形态不规则病理的更强健范式——ERF扩展至84.12%贡献面积为捕捉长程空间依赖提供了切实的物理基础,其效果足以媲美重型Transformer架构,但仅消耗轻量卷积开销。对比评估表明,LEAFDet建立了新的SOTA水平。结果重新定义了效率边界:在超越DINO和RTDETR等重型架构的精度记录的同时,维持了显著高于YOLOv11等当代实时检测器的推理速度。此外,成功的边缘原生部署证实,异步执行流水线能够在移动平台上稳定实现确定性实时性能,而不会触发热降频或过高功耗。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号