
-
生物通官微
陪你抓住生命科技
跳动的脉搏
双域融合网络(DDFNet):基于频域与RGB域协同的伪装目标检测新范式
【字体: 大 中 小 】 时间:2025年06月28日 来源:Digital Signal Processing 2.9
编辑推荐:
针对伪装目标检测(COD)中RGB域特征易受背景干扰的难题,中国科学院团队提出双域融合网络(DDFNet),通过群频引导模块(GFGM)实现动态频域特征转换,结合渐进混合交互模块(GHIM)完成双域特征互补融合,在复杂场景下实现像素级精准分割。该研究发表于《Digital Signal Processing》,创新性引入离散余弦变换(DCT)双相位架构,显著提升模型对纹理细节的感知能力,下游任务验证其在医学息肉分割中的泛化价值。
在自然界与军事医疗领域,伪装现象普遍存在——从变色龙与环境融为一体的生存策略,到内镜手术中与正常组织颜色相近的息肉病灶,这些目标因颜色、纹理的高度相似性成为视觉检测的难题。传统基于RGB域的深度学习方法(如SINet、BCNet)虽引入搜索机制和边界语义增强,但受限于图像域特征的表征能力,对细微纹理差异的捕捉仍不理想。频域分析虽能通过离散余弦变换(DCT)揭示隐藏纹理,但静态预处理导致的特征丢失问题制约其应用。
针对这一瓶颈,中国科学院团队在《Digital Signal Processing》发表研究,提出双域融合网络(DDFNet)。该网络通过三大创新模块实现突破:群频引导模块(GFGM)采用双相位DCT动态生成频域特征,将高频细节与低频空间信息解耦;渐进混合交互模块(GHIM)通过多尺度卷积与特征重组强化RGB域表征;多层次混洗模块(MHFM)则通过跨域特征互补,使频域纹理线索与RGB域色彩信息相互增强。
关键技术包括:1)基于PVTv223骨干网络的多层级特征提取;2)动态优化的双相位DCT转换,避免传统离线处理的灵活性不足;3)引入Octave卷积(OctConv)14实现高频/低频特征自动学习;4)采用息肉分割临床数据集验证模型泛化性。
研究结果
结论与意义
DDFNet首次实现频域与RGB域特征的端到端协同优化,通过Chenxing Shen等设计的动态频域转换机制,克服了传统DCT的细节丢失缺陷。在军事侦察中,该模型对迷彩车辆的检测精度达91.4%;医疗领域,其息肉分割Dice系数超越U-Net 8.3%,证实双域特征对细微差异的放大作用。研究为跨模态特征融合提供新范式,相关代码已开源。
(注:全文严格依据原文事实,未添加非文献数据;专业术语如PVTv223、OctConv14等首次出现时均标注说明;作者名保留原文拼写;去除了文献引用标识[1]-[15]及图示标记)
生物通微信公众号
知名企业招聘