《Smart Agricultural Technology》:EBGC-RTDETR: A lightweight model for eggplant disease detection with enhanced RT-DETR architecture
编辑推荐:
本研究针对现有模型在茄子病害检测中存在的病灶特征表征不足、多尺度特征融合能力有限以及模型轻量化部署困难等问题,提出了一种基于RT-DETR-r18改进的EBGC-RTDETR模型。通过引入高效通道注意力(ECA)模块增强病灶表征,设计基于Ghost-Shuffle卷积(GSConv)的双向特征金字塔网络(GS-BiFPN)实现高效多尺度特征融合,并结合Group-Taylor剪枝与通道级知识蒸馏(CWD)策略,显著降低了模型参数量(51.5%)和计算复杂度(GFLOPs,67.2%),同时提升了检测精度(mAP0.5提升2.3%)。该研究为复杂自然环境下农作物病害的智能精准识别提供了轻量化解决方案,对推动智慧农业应用具有重要理论价值与实践意义。
茄子作为全球广泛种植的重要蔬菜作物,在其生长过程中极易受到灰霉病、褐腐病、霜霉病等多种病害的侵袭,严重威胁产量和品质。传统的病害诊断主要依赖经验丰富的农民或植保专家进行肉眼观察,这种方法耗时费力且易受主观因素影响。随着深度学习技术的发展,基于图像的植物病害自动检测方法展现出巨大潜力。然而,在真实的田间复杂场景下,模型面临着病灶特征不明显、尺度变化大、背景复杂以及计算资源受限等挑战。现有的模型如RT-DETR在精度和速度上取得了较好平衡,但其参数量和计算成本较高,难以在移动设备等资源受限平台上高效部署。因此,开发一种兼具高精度、高效率且轻量化的病害检测模型,对于实现茄子病害的实时精准防控、推动智慧农业发展具有重要意义。本研究旨在解决上述问题,相关成果发表在《Smart Agricultural Technology》期刊上。
为开展研究,研究人员主要采用了以下几种关键技术方法:首先,构建了一个包含7种常见茄子病害和健康果实的图像数据集,共计1814张原始图像,并进行了数据增强;其次,在RT-DETR-r18模型基础上,引入了高效通道注意力(ECA)模块以增强特征提取能力;第三,设计了一种基于Ghost-Shuffle卷积(GSConv)的轻量级双向特征金字塔网络(GS-BiFPN)用于多尺度特征融合;第四,应用了Group-Taylor分组剪枝策略对模型进行压缩;最后,采用了通道级知识蒸馏(CWD)方法以恢复剪枝后模型的性能。实验在配备NVIDIA RTX 4090 D GPU的高性能计算平台上进行,使用PyTorch框架。
3.1. 不同注意力机制的模型实验结果
研究人员比较了多种注意力机制对模型性能的影响。实验结果表明,ECA注意力机制在几乎不增加参数和计算量的前提下,有效提升了模型的召回率(R)、平均精度(mAP0.5)和F1分数,展现了其在增强病灶特征表征方面的优势,最终被选入EBGC-RTDETR模型。
3.2. 不同特征融合网络的比较
通过对比FPN、PANet、BiFPN和提出的GS-BiFPN等特征融合网络,研究发现GS-BiFPN取得了最佳的综合性能,其精确度(P)达到90.1%,F1分数达到87.4%,同时参数量和GFLOPs有所降低,证明了其在多尺度特征融合和轻量化方面的有效性。
3.3. 消融实验
3.3.1. EBGC-RTDETR消融分析
系统的消融实验验证了ECA(E)、GS-BiFPN(B)、Group-Taylor剪枝(G)和CWD蒸馏(D)四个模块的贡献。结果表明,逐步引入这些模块后,模型在保持轻量化的同时,检测精度稳步提升,最终EBGC-RTDETR模型在mAP0.5上比基线模型提升了2.3%。
3.3.2. 消融结果的统计显著性
对消融实验结果进行的统计显著性分析表明,各改进模块带来的性能提升具有统计学意义(p值均小于0.05),证实了改进的有效性。
3.3.3. 消融结果可视化
训练损失曲线可视化显示,EBGC-RTDETR模型具有更低的损失值和更快的收敛速度,印证了其性能优势。
3.4. 模型剪枝实验结果比较
研究人员比较了Group-Taylor、LAMP和L1三种剪枝策略。结果表明,Group-Taylor剪枝在较高的剪枝比例(2.5)下,能最大程度地压缩模型(参数量降至9.6M,GFLOPs降至18.7G),同时保持较高的检测精度(mAP0.5仅下降0.3%),表现最为稳定。
3.5. 知识蒸馏实验
3.5.1. 蒸馏比例对模型性能的影响
实验发现,蒸馏比例为0.08时,学生模型能取得最佳的性能平衡。
3.5.2. 蒸馏层对学生模型性能的影响
结合浅层和深层特征进行蒸馏(层3,5,6,7,23,26,29)效果最好,有助于模型同时学习细节和语义信息。
3.5.3. 不同知识蒸馏方法的性能比较
在多种蒸馏方法中,通道级知识蒸馏(CWD)方法效果最优,能有效提升学生模型的性能。
3.6. 不同模型的对比实验
将EBGC-RTDETR与RT-DETR系列、YOLO系列等主流模型进行对比。结果表明,EBGC-RTDETR在精度(mAP0.5为89.7%)和轻量化(参数量9.6M,GFLOPs为18.7)方面均具有显著优势,其性能提升具有统计显著性。
3.7. 不同病害类别的精度比较
对不同病害类别的检测精度进行分析,发现EBGC-RTDETR在蓟马、霜霉病和花叶病毒病等类别上提升尤为明显,显示了其良好的多类别识别适应性。
3.8. 不同模型的热图检测结果
通过可视化模型的注意力热图,发现EBGC-RTDETR对病灶区域的聚焦更准确、更纯净,背景干扰更少,验证了其改进策略在特征提取方面的有效性。
3.9. 移动端部署与系统验证
研究成功将EBGC-RTDETR模型部署到Android移动设备上,开发了边缘侧推理系统。实测单帧推理延迟在141-166毫秒之间,证明了模型在资源受限设备上的实用性和高效性。
研究的讨论部分对改进算法的协同优化机制、不同模型的可视化结果以及模型局限性进行了深入分析。指出EBGC-RTDETR通过ECA、GS-BiFPN、Group-Taylor剪枝和CWD蒸馏的协同作用,实现了从特征增强、结构压缩到知识迁移的全流程优化。可视化对比证实了EBGC-RTDETR在定位精度、置信度稳定性和病灶边界贴合度方面的优势。同时,也承认模型在检测极早期症状、极端光照变化下的目标以及形态高度相似的背景纹理时仍存在挑战,例如漏检和误检,为未来研究指明了方向。
综上所述,本研究提出的EBGC-RTDETR模型成功解决了茄子病害检测中的病灶特征聚焦、多尺度融合和模型轻量化等关键问题。通过集成注意力机制、轻量级特征融合网络、结构化剪枝和知识蒸馏等先进技术,在显著降低模型复杂度的同时,实现了检测精度的提升,并验证了其在移动端的部署可行性。该研究为复杂农业环境下的作物病害实时精准检测提供了有效的技术方案,对推动智能农业装备的发展和应用具有重要的参考价值。