基于频域的边缘感知技术在伪装物体检测中的应用
《Computer Vision and Image Understanding》:Frequency domain-based edge sensing for camouflaged object detection
【字体:
大
中
小
】
时间:2026年02月13日
来源:Computer Vision and Image Understanding 3.5
编辑推荐:
伪装物体检测中的边缘感知与频率域协同方法研究,提出FDESNet框架,通过FGEE模块融合空间频率信息,FPRM强化特征引导,EDHFA动态聚合边缘特征,显著提升复杂背景下的分割精度,实验验证优于15种SOTA方法。
葛斌|彭小龙|夏晨星|陈海龙
安徽科技大学计算机科学与工程学院,淮南,232001,中国
摘要
伪装对象检测(COD)是计算机视觉领域的一个新兴研究方向,它面临一个核心挑战:如何准确分割那些自然或人为隐藏在视觉上相似背景中的对象。在COD任务中,伪装对象在纹理和颜色上与周围环境高度相似,这使得传统的显著性线索不足以可靠地区分目标与背景。相比之下,边缘作为结构线索提供了更稳定和明确的边界信息,从而有助于准确定位伪装对象的轮廓。受此启发,我们提出了一种基于频率的边缘编码器(FGEE),该编码器采用空间-频率双分支级联架构,以实现多尺度边缘建模并提取更精确和细粒度的边缘特征。此外,我们引入了一个特征渐进强化模块(FPRM),该模块结合了反向注意力机制和可变形卷积来抑制前景干扰,并挖掘伪装对象的结构表示,以增强特征学习。我们还设计了一个基于边缘的分层特征聚合器(EDHFA),通过检测双分支特征之间的差异来动态整合上下文信息,生成初始边缘轮廓,并逐步细化边缘表示。在四个广泛使用的COD基准数据集上进行的广泛实验结果表明,所提出的FDESNet超越了15种最先进的方法,在分割性能上取得了显著改进。源代码可在以下链接获取:
https://github.com/Pengxiaolong293/FDESNet。
引言
伪装是自然界中普遍存在的适应策略(Fan等人,2021年;Bi等人,2021年;Wu等人,2021b年;Xiao等人,2024年;Liang等人,2024a年),使生物能够通过模仿颜色、纹理或形态无缝融入环境,从而躲避捕食者并提高生存能力。伪装对象检测(COD)(Fan等人,2020a年)旨在识别和分割这些与背景难以区分的目标。这项技术在多种应用中具有巨大潜力,例如医学图像分析(例如息肉分割)(Wu等人,2021a年;Fan等人,2020b年)、农业害虫监测(Rustia等人,2020年)和工业缺陷检测(Fang等人,2020年)。然而,与语义分割(Zhou等人,2025年;He等人,2024年)或显著对象检测(Zhu等人,2024年;Bao等人,2025年;Zhang等人,2025b年)不同,COD仍然是一个极具挑战性的任务,原因有以下几点:(1)伪装对象与其周围环境在颜色、纹理和其他视觉特征上的高度相似性;(2)对象在形态、大小和外观上的多样性;(3)杂乱场景中存在多个伪装目标。这些因素共同阻碍了传统分割方法的有效性。最近的研究(Chen等人,2022年;Sun等人,2023年;Liu等人,2024年)认识到边缘信息是解决COD的关键线索,因为准确划定对象-背景边界可以显著提高分割性能。虽然一些基于边缘的算法(Zhu等人,2022年;Sun等人,2022年)已经取得了令人鼓舞的进展,但它们在具有挑战性的场景中的边缘定位能力仍然有限——尤其是在低对比度或多对象遮挡的情况下。如图1所示,绿色边界框突出显示了在这种条件下对象边界定义不明确的情况。
传统的空间域方法(Chen等人,2022年;Sun等人,2023年;Liu等人,2024年;Zhu等人,2022年;Sun等人,2022年)在捕捉复杂边缘细节和处理模糊边界方面存在固有局限性,这使得在COD任务中进行精确的边缘定位特别具有挑战性。在伪装场景中,前景对象有意与背景共享相似的纹理和结构,导致语义对比度和局部空间线索变得不可靠。因此,不准确的边缘定位可能导致对象碎片化甚至完全丢失目标,严重降低检测性能。相比之下,频率域为图像表示提供了互补的视角:高频成分通常对应于边缘和纹理等尖锐的过渡,而低频成分则捕捉结构布局和光照变化。最近的研究(Zhong等人,2022年;Cong等人,2023年;Xie等人,2023年)表明,频率域信息是对视觉感知的宝贵补充,有助于多尺度图像分析。虽然空间域强调局部纹理和结构细节,但频率域在提取全局轮廓、边缘和周期性模式方面表现出色。然而,大多数现有的基于频率域的COD方法主要利用频谱信息作为全局表示,缺乏对边缘敏感的高频成分的显式建模。在复杂的伪装场景中,背景纹理也可能引入强烈但具有误导性的频率响应,这可能干扰准确的边界感知。通过应用频率变换(例如傅里叶变换Chi等人,2020年),可以隔离和增强边缘敏感区域,从而弥补空间域在弱边缘提取方面的不足。因此,整合空间域和频率域信息可以实现多尺度和多层次的特征互补。然而,如果不对面向边缘的频率线索进行选择性强调和有效引导,仅仅结合空间和频率特征是不够的。这一观察突显了设计一种更具针对性的空间-频率协作机制的必要性,该机制可以明确增强与边界相关的频率信息,同时抑制背景干扰。这种协同融合增强了边缘感知,并导致更丰富的边缘表示,最终提高了伪装对象的检测能力。
基于上述见解,本研究旨在通过整合空间域和频率域信息来增强边缘感知,从而更精确地分割伪装对象。具体来说,我们提出了一种名为基于频率域的边缘感知用于伪装对象检测(FDESNet)的新框架。通过在频率域捕获周期性模式和边缘变化,所提出的方法有效缓解了复杂场景中的边界定位不准确性。为此,我们首先引入了一种基于频率的边缘编码器(FGEE),该编码器采用了一种新颖的双分支级联结构,整合了空间和频率线索。这种设计有效抑制了噪声干扰,同时保留了关键的边缘细节。与传统基于卷积的方法相比,所提出的编码器促进了多尺度和多方向的边缘建模,从而显著增强了网络提取和区分边界特征的能力。此外,我们设计了一个特征渐进强化模块(FPRM),该模块采用了一种新颖的基于Sigmoid的反向引导机制,以充分利用伪装区域中的潜在特征。这种机制显著增强了模型对不同尺度对象的适应能力,并加强了其整体特征表示能力。最后,我们开发了一个基于边缘的分层特征聚合器(EDHFA),在统一框架中整合了边缘和伪装特征。通过利用平均池化和最大池化的互补特性,该模块有效补偿了缺失的边缘信息。通过渐进的多层次聚合,它产生了更精细和准确的分割结果。我们的主要贡献可以总结如下:
- •
我们设计了一种FGEE,它引导网络注意力关注关键边缘区域,并通过整合空间和频率域信息提取详细、全面和多尺度的边缘特征。
- •
我们提出了一种FPRM,该模块使用独特的反向引导机制,通过逐渐抑制检测到的目标区域,迫使网络关注被忽视的潜在区域,从而有效挖掘目标周围的补充细节信息,进一步增强特征表示能力。
- •
我们引入了一种EDHFA,该模块使用双分支池化策略(平均池化和最大池化)有效捕获跨尺度特征变化,并利用结果信息作为边缘感知权重,实现自适应特征融合,生成具有丰富细节和明确定义边界的预测图。
- •
为了验证我们方法的有效性,我们在四个广泛使用的COD数据集(CAMO Le等人,2019年;CHAMELEON Skurowski等人,2018年;COD10K Fan等人,2020a年;NC4K Lv等人,2021年)上进行了全面实验,实验结果表明,我们提出的方法在分割准确性和鲁棒性方面均优于现有的15种最先进方法。
部分摘录
伪装对象检测
早期的COD方法(Fan等人,2021年;Bi等人,2021年;Wu等人,2021b年;Afifi等人,2021年;Lu等人,2018年)主要依赖于传统的图像处理技术,如使用颜色直方图的低级特征提取(Afifi等人,2021年)和纹理过滤(Lu等人,2018年)。然而,这些方法在处理复杂场景和目标与其背景之间的高视觉相似性时适应性有限。
整体架构
所提出网络的整体架构如图2所示。具体来说,我们采用了预训练的PVTv2(Wang等人,2022年)作为骨干,从输入图像中提取多尺度特征。与传统的基于Transformer的模型不同,PVTv2采用了分层金字塔结构,有助于更高效的多尺度表示学习,这对于密集预测任务(如对象检测)特别有利。
数据集
本文研究了四个著名的COD基准数据集——CAMO(Le等人,2019年)、CHAMELEON(Skurowski等人,2018年)、COD10K(Fan等人,2020a年)和NC4K(Lv等人,2021年)。CAMO包含2500张图像,均匀分为伪装和非伪装两类(各1250张),涵盖了八种生物启发的伪装场景。该数据集专门用于评估模型在复杂模仿环境中的性能。
结论
在本文中,我们提出了一种名为FDESNet的新COD框架,该框架专注于频率域边缘感知学习。具体来说,我们采用PVTv2作为骨干,并引入了FGEE模块,该模块依次整合了空间域和频率域。FGEE首先在空间域提取语义对象特征,然后将其转换到频率域,以增强边缘特征融合,从而强调细粒度的边界细节。
CRediT作者贡献声明
葛斌:监督、资金获取。
彭小龙:写作——审稿与编辑、撰写——原始草稿、可视化、验证、监督、软件、资源、项目管理、方法论、调查、形式分析、数据管理、概念化。
夏晨星:监督。
陈海龙:监督、调查。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。
致谢
本工作得到了国家自然科学基金(62102003)、安徽博士后科学基金(2022B623)和安徽省自然科学基金(2108085QF258)的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号