
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于关键细粒度分数预测的Transformer架构(key-fg DETR)在复杂农田环境中伪装蝗虫目标检测的创新研究
【字体: 大 中 小 】 时间:2025年07月24日 来源:Frontiers in Plant Science 4.8
编辑推荐:
这篇研究提出了一种创新的Transformer检测框架key-fg DETR,通过整合细粒度分数预测器(FGSP)、掩码多层感知机(MaskMLP)、去噪模块和DropKey策略,显著提升了复杂农田环境中伪装害虫的检测性能。在COD10k和蝗虫数据集上的实验表明,该模型AP值分别达到36.31和75.07,较Deformable DETR提升2.3%-3.1%,召回率(Recall)和F1-score分别提高6.15%和6.52%,为农业害虫监测提供了鲁棒性解决方案。
昆虫通过长期进化形成的拟态能力使其在农业环境中难以检测,其中蝗虫因群体迁徙特性对作物造成毁灭性破坏。传统基于卷积神经网络(CNN)的方法在复杂背景下面临特征提取困难,而Transformer架构凭借全局注意力机制展现出显著优势。本研究首次提出量化伪装程度指标(CD),通过χ2距离计算目标与背景特征差异,验证蝗虫数据集的CD值达1.05,显著高于经典COD10k数据集。
数据集构建:基于GHCID数据集构建含2,379张图像的蝗虫数据集,通过EasyDL平台标注2,789个实例。创新性提出CD计算公式:CD = (Tgc < 0.9)/(Tgc ≥ 0.9),其中Tgc为前景与背景的χ2距离。数据增强采用粘贴复制和随机旋转策略,将样本量扩充至5,522张。
模型架构:key-fg DETR以ResNet-50为骨干网络,核心创新包括:
性能对比:在COD10k数据集上,AP50达78.23,较Deformable DETR提升17.64个百分点;蝗虫数据集上Recall提高20.55%,显著优于Faster R-CNN等传统模型。
可视化分析:热图对比显示,Deformable DETR存在背景误检(如将树枝识别为蝗虫),而key-fg DETR能精准定位目标。Res5层特征图显示模型有效滤除杂草干扰,证实多尺度特征提取的有效性。
该研究为农业害虫实时监测提供了突破性解决方案,其创新性体现在:1)首
生物通微信公众号
知名企业招聘