
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于空间-频率域调制与专家混合机制的水下目标检测网络SFUDNet研究
【字体: 大 中 小 】 时间:2025年06月13日 来源:Knowledge-Based Systems 7.2
编辑推荐:
为解决水下图像低亮度、色彩失真及噪声干扰导致的检测难题,中国科学院团队提出新型空间-频率域调制网络SFUDNet。该研究通过频率调制块(FMB)动态学习多粒度频率特征,结合空间-频率集成模块(SFI)实现跨域特征融合,在DUO和Brackish数据集上达到SOTA性能,为海洋环境监测与AUV应用提供关键技术支撑。
研究背景
海洋覆盖地球71%的面积,蕴藏着丰富的生物资源和矿产资源,但水下环境的复杂特性使得目标检测面临巨大挑战。光线在水中的吸收和散射效应导致图像出现低亮度、色彩偏移和模糊等退化现象,传统基于空间域的检测方法如SWIPENet虽有一定效果,但难以应对不同水域多变的退化模式。有趣的是,研究人员发现水下图像的傅里叶频谱中,低频和高频分量呈现独特的模糊分布规律——这一发现为频率域技术的应用提供了突破口。
研究设计与方法
中国科学院团队提出SFUDNet网络,其创新性体现在三个层面:(1)采用双分支结构解耦空间与频率特征;(2)设计频率调制块(FMB)通过专家混合机制(MoE)实现样本自适应的多尺度频率特征学习;(3)开发空间-频率集成模块(SFI)实现跨域特征交互。研究使用DUO(7,782张图像)和Brackish(11,000张图像)两个公开数据集验证性能,关键技术包括快速傅里叶变换(FFT)频谱分析和动态路由算法。
研究结果
网络架构优势
SFUDNet通过并行处理空间域RGB特征和频率域频谱特征,在特征提取阶段即建立互补机制。实验显示该设计使mAP(平均精度)提升4.7%,特别在强散射环境下优势显著。
频率调制块(FMB)效能
FMB模块包含4个专家网络,通过门控机制动态分配频率特征处理路径。消融实验表明,该设计使高频纹理特征的召回率提升12.3%,有效缓解水下图像细节丢失问题。
跨域特征融合
SFI模块采用交叉注意力机制,定量分析显示其使低频形状特征与空间特征的融合效率提升21%,在检测海参等低对比度目标时F1-score达到0.89。
结论与展望
该研究证实空间-频率域协同处理能显著提升水下目标检测性能,SFUDNet在DUO数据集上达到78.3% mAP,超越现有基线模型。频率域调制技术对解决色彩失真和散射噪声具有独特优势,但实时性(35FPS)仍制约其在资源受限设备上的部署。未来研究可探索轻量化频率变换算法,并扩展至水下三维目标检测领域。这项工作为《Knowledge-Based Systems》收录的创新成果,其方法论对医学影像处理等跨模态分析任务也具有借鉴意义。
生物通微信公众号
知名企业招聘