用于复杂场景中伪装物体检测的双分支跨层信息流网络
《ACM Transactions on Multimedia Computing, Communications, and Applications》:Dual-Branch Cross-Layer Information Flow Network for Camouflaged Object Detection in Complex Scenes
【字体:
大
中
小
】
时间:2025年11月07日
来源:ACM Transactions on Multimedia Computing, Communications, and Applications
编辑推荐:
伪装物体检测中,本文提出DCIFNet框架,通过混合CNN-ViT架构并行提取局部和全局特征,结合GLF模块自适应融合特征,并设计DCD模块缓解传统解码器的信息稀释问题。实验表明,DCIFNet在COD10K等数据集上较PRNet分别提升α指标0.11%、Eφ指标0.11%、Fβw指标1.38%,显著优于主流方法。
摘要
伪装物体检测(COD)旨在准确检测那些与背景融为一体的物体。尽管基于深度学习的方法显著提高了检测精度,但伪装物体与其环境在色彩和纹理特征上的相似性仍然存在重大挑战,尤其是在复杂场景中。现有的COD方法主要面临两个问题:(1)难以将详细特征与语义表示有效融合,导致融合特征中局部特征和全局特征之间的平衡不佳;(2)传统自上而下的解码器架构中信息逐渐稀释,导致边界定位不精确。为了解决多尺度特征增强和语义信息稀释这两个问题,我们提出了一种名为Dual-Branch Cross-Layer Information Flow Network(DCIFNet)的模型,用于复杂场景中的伪装物体检测。具体而言,我们的框架结合了CNN-ViT架构,以实现局部模式和全局上下文特征的并行提取。随后,采用全局局部融合(GLF)模块,在每个阶段通过门控权重迭代和自适应地融合全局特征和局部特征。此外,还设计了一种新的密集连接解码器(DCD)模块,以缓解传统自上而下解码器导致的信息稀释问题。大量实验表明,DCIFNet在四个广泛使用的基准数据集上的大多数性能指标上都优于其他主流COD模型。在COD10K数据集上,与最新的SOTA模型PRNet相比,DCIFNet在
、
和
这三个指标上分别提高了0.11%、0.11%和1.38%,显示出显著的性能提升。代码可在
https://github.com/WateverOk/DCIFNet获取。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号