编辑推荐:
为解决水下图像颜色失真、细节模糊和对比度低的问题,研究人员开展了 MWPRFN(多尺度小波金字塔递归融合网络)的研究。结果显示,该网络在五个基准数据集上显著提升了图像质量。其意义在于有效解决水下图像的混合退化问题,推动水下视觉领域发展。
在神秘的水下世界,水下图像的获取对于众多领域至关重要,无论是海洋生物研究、水下考古,还是水下工程检测等,都依赖清晰准确的水下图像。然而,现实却给水下图像获取带来诸多挑战。水下环境中,光线被大量吸收、散射,悬浮颗粒的干扰也十分严重,这使得水下图像常常出现颜色严重失真、细节模糊不清、对比度极低的情况。想象一下,在进行水下生物观察时,模糊的图像无法清晰呈现生物的形态特征,研究人员难以准确判断物种;在水下考古中,低对比度的图像让珍贵的文物细节难以辨认,增加了考古研究的难度。
为了突破这些困境,研究人员积极探索。在众多研究中,基于深度学习,特别是基于卷积神经网络(CNN)的方法取得了一定成果。但这些方法仍存在诸多不足,如难以有效处理混合退化问题,对高频和低频信息的处理能力有限,无法充分利用频率级特征,还常常忽略红、蓝通道的衰减,导致图像偏蓝或偏绿。面对这些难题,来自未知研究机构的研究人员开展了关于多尺度小波金字塔递归融合网络(MWPRFN)的研究。研究结果令人振奋,MWPRFN 在五个基准数据集上显著提升了水下图像的质量。与最先进的方法相比,客观图像质量指标如峰值信噪比(PSNR)平均提高了 3.45%,结构相似性指数(SSIM)平均提高了 1.32%,自然图像质量评估指数(NIQE)平均降低了 4.50%。这一成果对于推动水下视觉领域的发展意义重大,它让水下图像变得更加清晰、准确,为后续的相关研究和应用提供了有力支持,该研究成果发表在《Displays》上。
研究人员开展此项研究时用到了以下几个主要关键技术方法:采用离散小波变换(DWT)将图像分解为高频和低频分量,以便分别进行处理;利用多尺度动态跨层机制(DCLM)融合不同深度的特征,实现低频和高频特征的有效交互;通过高效上下文细化模块(ECRM)对低分辨率特征进行细化,提升图像对比度和特征表示;运用大气光补偿估计网络(ALCEN),结合空间域和频率域处理,补偿红、蓝通道的衰减。
下面来看具体的研究结果:
- 网络架构设计:MWPRFN 整体架构通过多阶段增强实现。其将图像特征分解为高频和低频子带分别进行增强,并且保留所有层级的低频图像并纳入低频增强分支。多频率信息交互金字塔网络(MFIPN)负责处理 DWT 得到的低频和高频分量,二者之间通过 DCLM 实现交互。两分支的 ALCEN 结合空间和频率域处理,有效补偿红、蓝通道的衰减。
- 实验评估:研究人员选取了 10 种对比方法,包括两种非学习方法和八种基于学习的方法,在五个数据集上进行评估。实验结果表明,MWPRFN 在定性和定量评估方面均优于现有的水下图像增强方法,在提升图像质量上效果显著。
在研究结论和讨论部分,MWPRFN 有效地解决了水下图像的颜色失真、细节模糊和对比度低的问题。通过 MFIPN 和 ALCEN 的多阶段增强,实现了频率域和空间域的互补处理,建立了低频和高频之间的动态跨层依赖关系。这一研究成果不仅为水下图像增强领域提供了新的解决方案,也为后续相关研究开辟了新的思路,在水下视觉相关的众多应用场景中具有极大的潜力,有望推动水下视觉技术的进一步发展,让人们能够更清晰地 “看清” 水下世界的奥秘。