基于Mamba架构的SAR图像去噪新方法RSS-Net:突破全局建模与计算效率的平衡难题
《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》:RSS-Net: A Mamba-Based Network for SAR Image Denoising
【字体:
大
中
小
】
时间:2025年12月25日
来源:IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing 5.4
编辑推荐:
本文针对合成孔径雷达(SAR)图像固有的相干斑噪声严重制约下游应用的问题,提出了一种基于状态空间模型(SSM)的新型去噪网络RSS-Net。该网络创新性地融合了Mamba架构的长程依赖建模能力和卷积神经网络(CNN)的局部特征提取优势,通过引入残差状态空间块(RSSB)和二维选择性扫描(SS2D)机制,在保持线性计算复杂度的同时有效缓解了细节模糊问题。实验表明该方法在PSNR、SSIM、ENL等指标上均优于现有主流方法,为SAR图像处理提供了新的研究范式。
合成孔径雷达(SAR)作为一种主动式微波成像系统,具备全天时、全天候的对地观测能力,在海洋监测、军事测绘和资源勘探等领域发挥着不可替代的作用。然而,其独特的相干成像机制在带来高分辨率优势的同时,也不可避免地引入了相干斑噪声(Speckle Noise)。这种噪声表现为图像上随机分布的亮暗斑点,严重降低了图像质量,使得关键的地物轮廓和纹理细节被淹没,给后续的目标识别、分类等应用带来了巨大挑战。
传统上,研究人员采用滤波算法或基于统计模型的方法来抑制SAR图像中的相干斑噪声。虽然这些方法在一定程度上能够抑制噪声,但往往存在过度平滑导致边缘信息丢失,或引入人工伪影等问题。其根本原因在于,这些方法依赖于预先建立的模型和假设,难以充分适应SAR图像噪声复杂的非线性特性。随着深度学习技术的兴起,基于卷积神经网络(CNN)的方法在SAR图像去噪中展现出潜力。然而,CNN的局部感受野限制使其难以捕捉图像中远距离像素之间的全局关联,在处理复杂场景时表现受限。近年来,Transformer架构凭借其自注意力(Self-Attention)机制能够进行全局空间建模,在去噪任务中取得了显著效果。但Transformer需要计算所有像素对之间的相似度,导致计算复杂度与图像尺寸呈二次方增长,这使其在处理大规模高分辨率图像时面临巨大的计算和存储开销瓶颈。
为了在全局建模能力和计算效率之间找到平衡,一项发表于《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》的研究提出了一种全新的解决方案——RSS-Net。该研究团队将近年来在序列建模中表现出色的Mamba模型引入SAR图像去噪领域。Mamba模型基于状态空间模型(State Space Model, SSM),通过结构化状态矩阵和硬件感知算法,优化了标准SSM的隐藏状态转换机制,将其计算复杂度降低至线性级别,从而有效解决了Transformer在长序列处理中的计算瓶颈。
研究人员开展这项研究的核心目标是设计一个能够同时兼顾长程上下文依赖建模和高效计算的SAR图像去噪网络。他们提出的RSS-Net建立在编码器-解码器(Encoder-Decoder)架构之上,其核心创新在于引入了残差状态空间块(Residue State-Space Block, RSSB)。该模块巧妙地融合了视觉状态空间模块(Vision State Space Module, VSSM)和基于CNN的通道注意力块(Channel Attention Block, CAB)。VSSM模块利用二维选择性扫描(2D-Selective Scan, SS2D)技术,通过上下左右四个方向扫描图像,能够更全面地获取SAR图像中的空间信息特征。这种多方向扩展和融合策略显著增强了对图像中方向性和位置性特征的捕捉能力。而CAB模块则通过自适应权重分配,优先处理重要的特征通道,同时抑制噪声主导的通道,从而优化局部特征的提取。RSSB模块通过两次残差连接,将Mamba的全局依赖建模能力与CNN的局部特征提取优势高效集成,旨在有效缓解现有SAR去噪方法中常见的细节模糊问题,并加强高频图像细节的恢复。
在技术方法层面,本研究的关键步骤包括:网络架构采用编码器-解码器设计,编码器通过层次化下采样构建多尺度特征金字塔,解码器通过渐进式上采样和特征融合重建高分辨率清洁特征;损失函数设计结合了L1损失、Gamma-KL散度损失和SSIM损失,分别约束像素级误差、统计特征匹配和结构相似性保持;实验数据采用BSDS500数据集生成模拟SAR图像进行训练,并在Kodak24、UC Merced数据集以及真实的TerraSAR-X和HRSID图像上进行测试。
研究结果部分通过系统的实验验证了RSS-Net的优越性能。在模拟SAR图像测试中,该方法在不同视数(Look Number, L)条件下均取得了领先的指标。当噪声最强(L=2)时,RSS-Net的平均峰值信噪比(PSNR)比SAR-BM3D、SAR-CAM、SAR-CNN、SAR-DCNN和HTC-Net分别高出9.4%、3.3%、2.1%、1.6%和1.1%;平均结构相似性(SSIM)指标分别提高了22.9%、6.9%、3.4%、2.2%和0.8%。视觉对比结果显示,RSS-Net在有效抑制噪声的同时,能更好地保留物体的轮廓和边缘细节,更接近原始图像。
在真实SAR图像测试中,研究团队选取了来自TerraSAR-X和HRSID的两幅图像进行评估。在等效视数(ENL)、均值比(MOR)和边缘保持指数(EPI)等SAR图像专用指标上,RSS-Net均表现出最佳性能。其ENL值在选定的均匀区域最高,表明对平滑区域的噪声抑制效果最强;MOR和EPI值最接近理想值1,有效保留了辐射特性和边缘结构信息。同时,得益于Mamba的线性计算复杂度,RSS-Net在处理较大尺寸图像(如800×800)时,计算量增长相对平缓,展现了良好的可扩展性。
消融实验进一步验证了VSSM和CAB模块的有效性。实验结果表明,单独使用CAB模块能够通过通道注意力机制提升局部纹理结构的保持能力,但缺乏长程依赖捕捉能力;单独使用VSSM模块能通过全局建模显著改善连续地物结构的恢复能力,但会导致局部信息损失。当两者结合在RSSB模块中时,形成了“全局依赖捕获与局部特征优化”的协同机制,各项指标均达到最优,证明了该设计的合理性。
研究的结论部分强调,RSS-Net成功地将Mamba模型应用于SAR图像去噪任务,解决了CNN局部感受野有限和Transformer计算复杂度高的双重挑战。该方法在抑制相干斑噪声和保持纹理细节之间取得了显著平衡,不仅提供了优异的去噪性能,而且由于线性计算复杂度而具备较高的计算效率。这项研究证明了状态空间架构在SAR图像处理中的可行性,为解决SAR处理中“全局-局部-效率”的冲突提供了新的范式。然而,研究也指出该方法在处理高强度噪声图像时仍有改进空间,需要进一步的研究探索。这项工作为SAR图像处理领域的发展开辟了新的方向,对未来研究具有重要的启发意义。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号