基于双注意力与跨物理引导Transformer的水下图像同步增强与超分辨率重建方法研究

【字体: 时间:2025年06月30日 来源:Displays 3.7

编辑推荐:

  针对水下图像因光散射/吸收导致的低分辨率、非均匀光照(NUI)等问题,研究人员提出DAPT-SESR方法,通过多头协方差注意力(MCA)、双注意力Transformer块(DATB)和跨物理引导Transformer块(CPTB),实现水下图像增强(UIE)与超分辨率(SR)的同步优化。实验表明该方法在定量与定性评估中均优于现有技术,为海洋探测提供高效视觉解决方案。

  

水下环境因其独特的光学特性成为视觉处理的重大挑战。光线在水中经历散射和吸收后,成像系统捕获的图像往往呈现低对比度、颜色失真和细节丢失。更棘手的是,辅助光源的使用导致非均匀光照(NUI)现象,而水下通信带宽限制又迫使图像采用低比特率传输,进一步加剧分辨率下降。传统方法通常将图像增强(UIE)与超分辨率(SR)分步处理,但UIE引入的噪声在SR阶段会被放大,且水下设备的有限算力难以支撑串联任务的实时需求。

针对这一系列问题,研究人员提出DAPT-SESR框架,首次将双注意力机制与物理先验融合引入Transformer架构。该研究通过三个核心创新点破解水下视觉难题:首先,针对水下光衰减不一致性设计的多头协方差注意力(MCA),通过计算通道特征的协方差矩阵动态补偿信息损失;其次,串联空间与通道Transformer构成的双注意力块(DATB),实现局部退化特征与全局上下文协同提取;最后,创新性利用传输图作为物理引导,通过跨物理引导Transformer块(CPTB)将退化图像与传输图交叉注意力计算,有效抑制NUI区域的过增强或欠增强现象。

关键技术方法
研究采用编码器-解码器结构,输入为3通道退化图像Xd∈R3×H×W与1通道传输图Xt∈R1×H×W,经CPTB融合为4通道特征。训练使用Adam优化器(β=0.9,0.999),初始学习率1e-3,采用余弦退火策略调整至2e-6。网络嵌入维度32,在NVIDIA RTX 3090上以batch size=16训练500轮次。

研究结果

  1. MCA机制验证:通过计算通道协方差建立注意力权重,实验显示蓝色通道(水下衰减最严重)获得最高补偿权重,色偏校正效果较基线提升23.6%。
  2. DATB结构优化:空间Transformer优先处理局部模糊,通道Transformer后续校正色彩失真,这种级联设计使PSNR指标提升1.7dB。
  3. CPTB物理融合:以传输图生成Q(query),退化图像生成K(key)/V(value)的交叉注意力机制,使NUI区域SSIM提高0.15,且避免人工光源造成的亮斑过曝。

结论与意义
DAPT-SESR首次实现水下图像增强与超分辨率的端到端联合优化,其创新性体现在:将物理模型深度嵌入Transformer架构,通过MCA和DATB解决传统方法中通道信息丢失与空间特征提取不足的缺陷;CPTB模块开创性地利用传输图引导注意力计算,为复杂光学环境下的图像恢复提供新范式。该方法在保持模型轻量化(仅1.2M参数)的同时,在UIEB数据集上达到0.91的UIQM分数,较次优方法降低37%推理耗时,显著提升水下机器人实时视觉的可靠性。论文成果发表于《Displays》,为海洋科考、水下考古等领域的视觉系统开发奠定理论基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号