基于关键细粒度分数预测的Transformer架构(key-fg DETR)在复杂农田环境中伪装蝗虫目标检测的创新研究

【字体: 时间:2025年07月24日 来源:Frontiers in Plant Science 4.8

编辑推荐:

  这篇研究提出了一种创新的Transformer检测框架key-fg DETR,通过整合细粒度分数预测器(FGSP)、掩码多层感知机(MaskMLP)、去噪模块和DropKey策略,显著提升了复杂农田环境中伪装害虫的检测性能。在COD10k和蝗虫数据集上的实验表明,该模型AP值分别达到36.31和75.07,较Deformable DETR提升2.3%-3.1%,召回率(Recall)和F1-score分别提高6.15%和6.52%,为农业害虫监测提供了鲁棒性解决方案。

  

引言

昆虫通过长期进化形成的拟态能力使其在农业环境中难以检测,其中蝗虫因群体迁徙特性对作物造成毁灭性破坏。传统基于卷积神经网络(CNN)的方法在复杂背景下面临特征提取困难,而Transformer架构凭借全局注意力机制展现出显著优势。本研究首次提出量化伪装程度指标(CD),通过χ2距离计算目标与背景特征差异,验证蝗虫数据集的CD值达1.05,显著高于经典COD10k数据集。

材料与方法

数据集构建:基于GHCID数据集构建含2,379张图像的蝗虫数据集,通过EasyDL平台标注2,789个实例。创新性提出CD计算公式:CD = (Tgc < 0.9)/(Tgc ≥ 0.9),其中Tgc为前景与背景的χ2距离。数据增强采用粘贴复制和随机旋转策略,将样本量扩充至5,522张。

模型架构:key-fg DETR以ResNet-50为骨干网络,核心创新包括:

  1. FGSP模块:通过空间先验图引导查询向量聚焦潜在目标区域,提升细粒度特征判别力;
  2. MaskMLP双分支:空间分支抑制遮挡边界噪声,通道分支关闭无关特征通道,通过Sigmoid生成像素级软掩码;
  3. 去噪模块:采用匈牙利算法稳定偏移量学习,加速模型收敛;
  4. DropKey策略:在自注意力中引入可控稀疏性,保留长程依赖关系。

实验结果

性能对比:在COD10k数据集上,AP50达78.23,较Deformable DETR提升17.64个百分点;蝗虫数据集上Recall提高20.55%,显著优于Faster R-CNN等传统模型。

可视化分析:热图对比显示,Deformable DETR存在背景误检(如将树枝识别为蝗虫),而key-fg DETR能精准定位目标。Res5层特征图显示模型有效滤除杂草干扰,证实多尺度特征提取的有效性。

结论

该研究为农业害虫实时监测提供了突破性解决方案,其创新性体现在:1)首

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号