基于双增强注意力机制与域自适应迁移学习的棉蚜自动检测方法研究

《ARTIFICIAL INTELLIGENCE REVIEW》:Automated detection of cotton aphids (Aphis gossypii Glover) using a bi-enhanced attention mechanism and domain-adaptive transfer learning strategy

【字体: 时间:2025年12月10日 来源:ARTIFICIAL INTELLIGENCE REVIEW 13.9

编辑推荐:

  本研究针对棉蚜(Aphis gossypii Glover)田间检测效率低下的问题,提出了一种结合双增强注意力机制(BEAM)和域自适应迁移学习策略的改进YOLOv8-s模型。通过在公开林业害虫数据集上预训练并基于自建棉蚜数据集微调,该方法在mAP@0.5:0.95、mAP@0.5和mAP@0.75指标上分别达到58.1%、95.4%和64.8%,显著提升了复杂田间环境下微小害虫的检测精度,为精准农业害虫防控提供了可靠的技术支持。

  
棉花作为重要的纤维和油料作物,在其生长过程中极易遭受棉蚜(Aphis gossypii Glover)等害虫的侵袭,严重影响着棉花的产量和品质。传统依赖人工翻查叶背的检测方法不仅效率低下,且长时间工作易导致视觉疲劳,严重影响检测准确性。随着害虫抗药性增强和农药过度使用带来的环境问题日益凸显,发展高效、准确的害虫自动检测技术已成为实现精准农业的关键环节。
当前,基于深度学习的目标检测方法在农业害虫识别领域展现出巨大潜力,然而将现有模型直接应用于田间环境下的棉蚜检测仍面临诸多挑战:棉蚜体型微小(平均宽度仅18.22像素,高度17.74像素),在暴发期往往密集出现;田间采集的图像存在光照变化、背景复杂、目标与背景相似度高、多尺度检测需求等问题;此外,大规模标注数据获取成本高昂,而棉蚜特有的生物学特性(如聚集在叶背)更增加了数据采集难度。
针对这些挑战,研究人员在《Artificial Intelligence Review》上发表了题为“Automated detection of cotton aphids using a bi-enhanced attention mechanism and domain-adaptive transfer learning strategy”的研究论文。该研究通过构建包含4,642张田间图像的专用棉蚜数据集,提出了一种融合双增强注意力机制(BEAM)的改进YOLOv8-s模型,并结合域自适应迁移学习策略,实现了复杂田间环境下棉蚜的高精度自动检测。
本研究采用的核心技术方法包括:首先构建了涵盖棉蚜不同形态(有翅型与无翅型)和颜色状态的专用数据集,通过随机旋转、平移、亮度调整、随机擦除和翻转等数据增强技术将训练集扩增至1,618张图像;其次提出了新型双增强注意力机制BEAM,通过并行整合坐标注意力(CA)和简单无参数注意力模块(SimAM),在保持计算效率的同时增强了对微小目标的特征提取能力;最后采用域自适应迁移学习策略,先在公共林业害虫数据集(包含31种害虫,样本来源于田间采集和受控环境)上预训练,再在自建棉蚜数据集上微调,有效缓解了目标与背景不平衡问题。
模型架构改进
研究以YOLOv8-s为基线模型,在其骨干网络的三个不同尺度特征图输出后分别嵌入BEAM模块。BEAM机制通过CA模块捕获空间坐标信息以增强小目标定位能力,同时利用SimAM模块基于能量函数计算注意力权重,突出显著特征。这种并行集成方式既保留了CA的全局信息捕获能力,又发挥了SimAM的特征显著性增强优势。
损失分析
训练过程中,模型在10,000次迭代内总损失从7.5迅速降至4.0,最终稳定在3.0左右。分类损失从初始的3.7降至1.0以下,表明模型能有效区分棉蚜与背景;边界框回归损失从2.6降至1.5,体现了定位精度的持续提升;分布焦点损失(DFL)从1.2稳定至0.9,改善了目标边界细节的捕捉能力。
棉蚜检测效果
在四组随机选取的田间图像测试中,改进模型对有无翅棉蚜均表现出精确检测能力。特别是在具有光照差异(直射光与阴影区域共存)、多尺度目标(大小个体混合)以及目标与背景高度相似(浅黄色棉蚜与叶脉颜色相近)的挑战性场景下,模型仍能准确识别,红色边界框标注无翅棉蚜,紫色边界框标注有翅棉蚜。
消融实验
基线YOLOv8-s模型的mAP@0.5:0.95为54.1%,单独加入BEAM模块后提升至55.8%,单独使用迁移学习策略提升至57.8%,而结合BEAM与迁移学习后达到最佳性能58.1%。在更严格的IoU阈值下,mAP@0.75从基线的56.7%显著提升至64.8%,证明BEAM对高精度定位有显著改善。
与先进小目标检测方法对比
与SPAR、RemDet-S和FBRT-YOLO-S等最新方法相比,本研究方法在mAP@0.5:0.95上分别高出1.4%、3.0%和1.2%。特别针对有翅棉蚜的AP@0.75达到72.7%,显著优于对比方法,体现了对形态复杂目标的优越检测能力。
模型可解释性分析
通过Grad-CAM++可视化发现,模型对有翅棉蚜重点关注翅膀和中后部体段,对无翅棉蚜则均匀关注全身特征。即使在图像模糊区域,模型仍能聚焦于棉蚜的关键特征,证明了BEAM模块在复杂环境下的鲁棒性。
类别不平衡分析
尽管有翅棉蚜在训练集中仅占3.7%(7,366个实例),但其平均面积(2,578.97平方像素)是无翅棉蚜(353.61平方像素)的7.3倍,更大的形态特征使其在检测中具有天然优势。模型在不同类别间保持了均衡的性能表现,验证了处理生物真实不平衡的有效性。
方法论优势与局限
本研究的主要创新在于BEAM模块的提出和域自适应迁移学习策略的应用,有效解决了小目标检测中的特征提取和域适应问题。然而,研究也承认在密集重叠场景下的检测仍有挑战,BEAM引入的计算复杂度增加可能影响部署效率,且模型目前仅针对棉蚜单一物种,对其他蚜虫物种的泛化能力有限。
结论与展望
该研究通过创新性地整合双增强注意力机制与域自适应迁移学习策略,显著提升了YOLOv8-s模型在复杂田间环境下检测棉蚜的性能。实验结果表明,该方法在多项检测精度指标上均优于现有先进方法,特别是在处理微小目标、复杂背景和多尺度检测任务时表现出色。研究构建的高质量棉蚜数据集和提出的BEAM模块为农业害虫检测领域提供了重要技术储备。
未来研究方向包括:采用半监督学习策略利用未标注图像扩展训练数据,开发实例分割算法以解决密集场景下的目标重叠问题;通过模型剪枝、量化和知识蒸馏等技术优化计算效率,适应边缘设备部署需求;扩展数据集涵盖多种蚜虫物种,提升模型泛化能力;最终实现基于检测结果的虫害等级划分和精准施药决策,构建完整的智能虫害管理系统。这些改进将推动精准农业技术的发展,为可持续农业生产提供有力支撑。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号