基于小波变换与多尺度Transformer网络的水下图像增强方法(WaveletFormer)
《Digital Signal Processing》:Underwater image enhancement by combining wavelet transform and multiscale transformer networks
【字体:
大
中
小
】
时间:2025年10月27日
来源:Digital Signal Processing 3
编辑推荐:
本文提出了一种结合小波变换与多尺度Transformer网络的水下图像增强方法WaveletFormer。针对水下图像存在的色彩失真、对比度下降及细节模糊等问题,作者设计了通道注意力Transformer(CAT)模块增强通道间全局依赖,小波注意力Transformer(WAT)模块恢复高低频特征,并创新性地引入空间-频率增强块(SFEB)实现频域特征自适应提取与多域深度融合。实验表明该方法在五个公共数据集上均优于现有技术,为水下光学图像在海洋探测、生态监测等领域的应用提供了重要技术支撑。
基于传统方法的水下图像增强可分为非物理模型和物理模型两类。非物理方法直接采用经典图像处理技术调整像素分布,包括直方图均衡化(HE)、基于Retinex的方法和对比度限制自适应直方图均衡化(CLAHE)等。例如,Ma等人通过结合YIQ和HIS空间的CLAHE与融合技术提升对比度,Li等人则……
WaveletFormer的整体结构如图2所示。该方法采用U-Net编码器-解码器架构,利用多尺度特征和频域信息使网络能够高效恢复退化图像。在编码器和解码器中分别构建了通道注意力Transformer(CAT)和小波注意力Transformer(WAT),以增强特征表达的多样性和丰富性。此外,空间-频率……
WaveletFormer基于PyTorch 1.11.0框架实现,在NVIDIA RTX 4090 GPU上训练400个epoch,批次大小为4。所有输入图像的空间分辨率调整为256×256,使用Adam优化器进行训练,初始学习率为1e-4。同时采用余弦退火算法调整学习率,并在前5个epoch进行学习率预热。
本研究提出了一种名为WaveletFormer的水下图像增强网络,将小波变换与多尺度Transformer网络相结合。通过将设计的CAT和WAT模块嵌入多尺度U-Net主干网络的编码器和解码器,该模型协同建模通道间的全局依赖性与局部细节特征,有效解决了全局结构恢复不足和细节增强不充分的问题……
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号