《Frontiers in Plant Science》:DFSNet: directional feature aggregation and shape-aware supervision for eggplant pest and disease detection
编辑推荐:
本综述提出DFSNet模型,通过引入PConv(Pinwheel Convolution)增强浅层特征提取、设计MSDA(Multi-Scale Directional Aggregation)模块实现多尺度定向特征聚合、构建CSP-MSLA(Cross-Stage Partial Multi-Scale Linear Attention)颈部网络结构,并采用SDDH(Shape-based Dynamic Detection Head)检测头,显著提升了自然环境下茄子果实病虫害(包括蛀果虫孔、果实腐烂病斑、瓜蓟马啃食痕等小目标)的检测精度。实验表明该模型在自建数据集上达到81.0%精确率、78.3%召回率和80.5% mAP@50,参数量仅1.8M,推理速度达378.13 FPS,为农业智能化监测提供了高效解决方案。
引言
茄子作为全球广泛种植的蔬菜,其生长周期中易受蛀果虫、真菌性腐烂病和瓜蓟马等病虫害侵袭,导致果实商业价值严重损失。传统依赖人工经验的诊断方法难以满足现代农业精准识别的需求,亟需开发高效智能检测技术。
轻量化目标检测网络结构演进
近年来,MobileNets、GhostNets等轻量化网络通过深度可分离卷积显著降低计算复杂度,但局部感受野限制其全局上下文信息捕获能力。YOLO系列单阶段检测模型通过骨干网络、颈部结构和检测头的协同优化,在实时目标检测任务中实现效率与性能平衡。例如SSD-YOLO模型通过集成SENetV2机制和DySample模块,以仅6MB参数量实现水稻病害高效检测。
频域特征建模与小波变换应用
离散小波变换(DWT)通过多尺度频带分解有效解耦结构与细节信息,在图像恢复、超分辨率和语义分割任务中展现显著优势。MWCNN引入DWT替代传统下采样,在压缩特征图的同时保留频域信息;WFS-YOLO通过DWT增强频域和空间域特征,提升复杂环境下小目标病虫害感知精度。
边缘与高频特征增强方法
针对病虫害边缘模糊问题,EGNet通过显式建模边缘特征指导目标定位,CBA-Net通过上下文边界感知机制强化显著物体轮廓捕获。DFSNet设计DEE(Directional Edge Enhancer)模块,通过多方向深度可分离卷积分支和双路径边缘增强,显式提升病虫害目标边缘响应能力。
多尺度注意力机制应用
SRCA注意力模块通过自适应加权和双向融合有效整合高低分辨率特征,MHCF编码器利用Transformer结构增强多尺度特征融合。DFSNet创新性构建CSP-MSLA结构,将多尺度线性注意力(MSLA)与跨阶段部分连接结合,实现关键病虫害区域的自适应增强。
DFSNet模型架构设计
整体网络在保持YOLOv11n基础框架上,针对病虫害"小尺度、多形态、弱边缘"特性进行优化:在骨干网络P1-P2层引入PConv增强方向性纹理特征表示;在P3-P5层嵌入C3K2-MSDA模块,通过WTConv(Wavelet Transform Convolution)和多方向卷积增强多尺度感知;颈部网络采用CSP-MSLA结构实现跨尺度语义关系建模;检测头部分引入基于尺度的动态损失(Scale-based Dynamic Loss),通过LSDB(边界框尺度动态损失)和LSDM(掩码尺度动态损失)自适应调整不同尺度目标的监督强度。
实验验证与结果分析
在自建茄子病虫害数据集(包含蛀果虫、腐烂病、瓜蓟马和健康果实四类样本)上,DFSNet相比基线模型精确率提升6.9个百分点,召回率提升8.8个百分点,mAP@50提高7.8个百分点。可视化分析显示,PConv在浅层特征提取中能更敏感地捕获蛀果虫孔的定向边缘结构,Grad-CAM热力图表明模型对病斑区域和啃食痕迹具有精准的空间注意力分布。在PlantDoc公开数据集上的跨域测试进一步验证了模型泛化能力。
结论与展望
DFSNet通过定向特征聚合和形状感知监督机制,有效解决了自然环境下病虫害检测的小目标挑战。未来可探索时序信息融合、知识蒸馏等技术,进一步提升模型在动态复杂场景下的适应性和部署效率。