基于八度变换器的跨频感知网络:针对 camouflage 物体检测的创新频率交互框架

【字体: 时间:2025年10月21日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  本文提出了一种新颖的跨频感知网络(CFANet),通过定位引导解码器结构(LGS)和讨论模块(DM)深度融合低频特征与多层级频率信息,结合八度卷积(OctConv)与Transformer的局部-全局频率交互机制(OTM),在伪装目标检测(COD)任务中实现了边缘精确定位与语义优化,为复杂场景下的医学影像分割(如息肉分割)和工业缺陷检测提供了新思路。

  
亮点
  • 我们提出了一种跨频感知网络(CFANet),利用定位引导解码器结构(LGS)充分挖掘低频特征与多层级频域信息的交互作用,精准捕捉伪装目标。
  • 为获取精确的深层低频特征,我们设计了讨论模块(DM),该模块在师生讨论框架下部署三名特征提取专家进行迭代优化,生成更准确的深层定位特征。
  • 为优化目标轮廓信息,我们提出八度变换器模块(OTM),通过Transformer与CNN结构融合高频及当前层低频特征,在局部与全局层面实现特征互补,提升检测精度。
  • 在四个基准数据集上的实验证实了CFANet在定性与定量分析中的有效性。
伪装目标检测研究现状
早期伪装目标检测方法依赖手工设计的低层特征(如纹理、3D凹凸性、运动信息)区分前景与背景。近年来,基于卷积神经网络(CNN)的COD方法显著提升检测能力。现有方法主要聚焦于通过注意力机制、边缘线索和多尺度聚合优化特征分辨率,但多频率信息的交互与优化常被忽视。
整体框架
CFANet的整体框架如图2所示。首先利用更精确的深层低频特征引导其他层级特征进行粗定位,随后结合Transformer与CNN促进高频-低频特征的交互,实现精细分割。CFANet包含编码器、用于提取精确深层特征的讨论模块(DM)、定位引导解码器(LGS)以及八度变换器模块(OTM)。
实验设置
数据集:我们在四个主流COD基准数据集上测试CFANet:CHAMELEON、CAMO、COD10K和NC4K。CHAMELEON含76张测试图像;CAMO包含1,250张多类别伪装图像(训练1,000张,测试250张);COD10K包含5,066张图像(训练3,040张,测试2,026张);NC4K含4,121张图像。为公平比较,所有模型均使用相同训练集。
结论
本文通过引入跨频感知网络(CFANet)为复杂场景中的精确目标识别提供新视角。该网络利用精准识别的深层特征引导其他层级,通过Transformer与CNN结构优化高-低频特征交互,实现伪装目标的快速有效分割。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号