DCSS-Net:一种用于水下图像增强的深度与颜色空间协同网络
《Digital Signal Processing》:DCSS-Net: Depth and color space synergy network for underwater image enhancement
【字体:
大
中
小
】
时间:2025年11月23日
来源:Digital Signal Processing 3
编辑推荐:
水下图像颜色偏差与细节模糊问题,现有方法多局限于RGB空间且物理特性建模不足。本文提出DCSS-Net,通过深度估计与RGB/LAB/HSV多颜色空间融合,结合自注意力与通道注意力模块(SCAM)、多颜色特征融合模块(MCSFFM)及智能区域聚焦机制(Agent Attention),有效提升图像质量与结构清晰度,实验表明该方法在复杂水下场景中具有更好适应性和鲁棒性。
本研究提出了一种新的水下图像增强网络(DCSS-Net),旨在解决水下图像中存在的颜色偏差和细节模糊等问题。水下光学图像在多个实际应用中具有重要意义,如海洋探索、水下监控、环境监测以及海洋机器人感知。然而,由于水下环境的特殊性,这些图像常常受到严重的退化影响,主要体现在两个方面:一是不同波长的光在水下传播时衰减速度不同,导致常见的蓝绿色偏色;二是悬浮颗粒引起的光散射干扰了正常的光传播路径,从而降低了图像的对比度并使细节变得模糊。这些退化效应在相机与场景之间的距离增加时尤为显著。因此,提升水下图像的质量对于准确分析和决策至关重要。
目前,水下图像增强方法可以大致分为三类:无模型方法、基于物理模型的方法以及基于深度学习的方法。无模型方法主要通过空间域中的像素级操作来改善图像质量,如增强对比度和饱和度。例如,Ancuti等人提出了一种多曝光融合框架,结合了颜色补偿和白平衡调整;Marques等人则利用对比度引导的直方图均衡化技术,同时增强细节和标准化亮度。随着研究的深入,形态学和结构分析方法也逐渐出现,如Kang等人提出的组件分解策略,以及Subramani等人基于上下文的对比度增强技术。然而,这些无模型方法通常忽略了水下图像退化中的物理特性,尤其是深度信息,从而导致颜色失真或对噪声结构的过度增强,特别是在蓝绿色主导的场景中。
相比之下,基于物理模型的方法通过明确的物理模型来形式化图像退化过程。例如,Alenezi等人利用颜色通道相关梯度和吸收差异分析来增强传输图的估计;Zhou等人则将光衰减模式与深度感知的特征先验相结合;Chandrasekar等人开发了一个混合框架,整合了深度引导的成像模型和基于Retinex的优化。此外,跨域适应方法也逐渐兴起,如Berman等人应用大气去雾原理,通过RGB空间中的雾线分布分析来提升图像清晰度;Yuan等人则分别在两种颜色空间中利用暗通道先验和颜色补偿技术增强图像的可见性。然而,由于水下环境的复杂性和多变性,这些方法所设定的参数和先验条件往往难以全面适应特定的场景。
基于深度学习的方法在水下图像增强方面取得了显著进展,通过克服传统方法的局限性,实现了更高效的图像质量提升。早期研究主要集中在优化网络架构上,例如Jiang等人开发了一种轻量级的多尺度网络,基于拉普拉斯金字塔结构,通过递归策略和残差学习提高了性能。为了进一步提升增强效果,研究者开始探索不同的颜色空间,如Wang等人首次在HSV颜色空间中进行研究,以调整亮度和饱和度;Zhou等人则进一步结合了RGB和HSV颜色空间,利用注意力机制和颜色引导图来指导网络的聚焦区域。然而,这些方法通常需要大量成对的退化与干净图像数据集,这在水下场景中由于环境的多样性和数据的稀缺性而变得难以实现。因此,无监督学习方法,特别是生成对抗网络(GANs),受到了广泛关注。例如,Jiang等人利用全局-局部对抗机制来监督图像的真实性,但仅依赖于网络映射往往无法全面增强水下图像,常导致残余的蓝绿色偏色。
为了解决上述问题,本研究提出了一种新的方法,该方法结合了物理先验知识和多色域空间信息。通过整合注意力估计、场景重建训练以及多色域空间特征融合,该方法有效增强了深度图与水下场景之间的相关性,弥补了单一RGB颜色空间在亮度和饱和度等图像属性上的忽视,从而提升了特征表示能力和模型对多样化场景的适应性。具体而言,我们设计了一个嵌入在编码器-解码器网络中的自注意力与通道注意力模块(SCAM),用于建模水下场景的深度上下文,从而实现对严重退化区域的精确细节重建。同时,我们还开发了一个多色域空间特征融合模块(MCSFFM),该模块融合了RGB、LAB和HSV颜色空间的特征,并引入了代理注意力机制,该机制基于融合后的多色域特征和原始图像信息,能够自适应地增强严重退化的区域,从而有效保留水下图像中的关键视觉细节。
本研究的主要贡献包括以下几个方面:首先,我们提出了DCSS-Net,该网络通过整合深度信息与RGB、LAB和HSV特征,克服了单一域方法的局限性,实现了在复杂水下环境中稳健的颜色保真度和结构保留。其次,我们设计了自注意力与通道注意力模块(SCAM),该模块嵌入在编码器-解码器架构中,能够高效捕捉水下场景中的全局依赖和通道依赖,从而显著提升深度估计的准确性。最后,我们开发了多色域空间特征融合模块(MCSFFM),该模块不仅融合了RGB、LAB和HSV颜色空间的特征,还引入了代理注意力机制,该机制能够基于融合后的多色域特征和原始图像信息,自适应地增强严重退化的区域,从而在多种水下场景中有效保留关键的视觉细节。
为了评估所提出模型的性能,我们使用了四个数据集进行实验,包括两个经典基准数据集和两个补充数据集,以增强评估的全面性:UIEB数据集、EUVP数据集、DepondFI数据集以及高浑浊度的DepondFI数据集。UIEB数据集包含950张真实水下图像,分为890对原始水下图像及其对应的高质量参考图像,以及60张未配对的图像。通过这些数据集的实验,我们验证了DCSS-Net在提升水下图像质量方面的有效性,并在视觉质量和定量指标上均取得了显著的改进。此外,我们还对模型的鲁棒性和泛化能力进行了测试,以确保其在不同水下环境下的适用性。
本研究的创新点在于将深度信息与多色域空间特征相结合,从而更全面地理解和处理水下图像的退化问题。传统的水下图像增强方法往往局限于单一颜色空间,而未能充分考虑深度信息对图像质量的影响。因此,我们提出的DCSS-Net通过引入深度感知和多色域空间分析,能够更准确地捕捉水下场景的物理特性,从而实现更有效的图像增强。在实际应用中,这一方法可以显著提升水下图像的清晰度和色彩准确性,为海洋探索、水下监控和环境监测等领域提供更可靠的视觉数据支持。
此外,本研究还探讨了模型在不同水下场景下的表现,包括不同水深、不同水体类型以及不同光照条件下的图像增强效果。通过对比实验,我们发现DCSS-Net在处理高浑浊度和远距离水下图像时,相较于传统的单色域增强方法,能够更有效地保留细节并减少颜色偏差。这一结果表明,DCSS-Net不仅在理论上具有创新性,而且在实际应用中也展现出良好的性能和适应性。
最后,本研究的成果得益于国家自然科学基金和福建省自然科学基金的支持,这些资金为研究的顺利进行提供了重要的保障。我们衷心感谢所有为本研究提供帮助和指导的老师与同学们,并感谢资助项目对本研究的大力支持。未来,我们将继续优化DCSS-Net的性能,探索其在更复杂水下环境中的应用潜力,并致力于将其推广至更广泛的水下图像处理领域。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号