基于双注意力与跨物理引导Transformer的水下图像同步增强与超分辨率重建方法研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月30日 来源：Displays 3.7

编辑推荐：

　　针对水下图像因光散射/吸收导致的低分辨率、非均匀光照(NUI)等问题，研究人员提出DAPT-SESR方法，通过多头协方差注意力(MCA)、双注意力Transformer块(DATB)和跨物理引导Transformer块(CPTB)，实现水下图像增强(UIE)与超分辨率(SR)的同步优化。实验表明该方法在定量与定性评估中均优于现有技术，为海洋探测提供高效视觉解决方案。

水下环境因其独特的光学特性成为视觉处理的重大挑战。光线在水中经历散射和吸收后，成像系统捕获的图像往往呈现低对比度、颜色失真和细节丢失。更棘手的是，辅助光源的使用导致非均匀光照(NUI)现象，而水下通信带宽限制又迫使图像采用低比特率传输，进一步加剧分辨率下降。传统方法通常将图像增强(UIE)与超分辨率(SR)分步处理，但UIE引入的噪声在SR阶段会被放大，且水下设备的有限算力难以支撑串联任务的实时需求。

针对这一系列问题，研究人员提出DAPT-SESR框架，首次将双注意力机制与物理先验融合引入Transformer架构。该研究通过三个核心创新点破解水下视觉难题：首先，针对水下光衰减不一致性设计的多头协方差注意力(MCA)，通过计算通道特征的协方差矩阵动态补偿信息损失；其次，串联空间与通道Transformer构成的双注意力块(DATB)，实现局部退化特征与全局上下文协同提取；最后，创新性利用传输图作为物理引导，通过跨物理引导Transformer块(CPTB)将退化图像与传输图交叉注意力计算，有效抑制NUI区域的过增强或欠增强现象。

关键技术方法
研究采用编码器-解码器结构，输入为3通道退化图像X_d∈R^3×H×W与1通道传输图X_t∈R^1×H×W，经CPTB融合为4通道特征。训练使用Adam优化器(β=0.9,0.999)，初始学习率1e-3，采用余弦退火策略调整至2e-6。网络嵌入维度32，在NVIDIA RTX 3090上以batch size=16训练500轮次。

研究结果

MCA机制验证：通过计算通道协方差建立注意力权重，实验显示蓝色通道（水下衰减最严重）获得最高补偿权重，色偏校正效果较基线提升23.6%。
DATB结构优化：空间Transformer优先处理局部模糊，通道Transformer后续校正色彩失真，这种级联设计使PSNR指标提升1.7dB。
CPTB物理融合：以传输图生成Q(query)，退化图像生成K(key)/V(value)的交叉注意力机制，使NUI区域SSIM提高0.15，且避免人工光源造成的亮斑过曝。

结论与意义
DAPT-SESR首次实现水下图像增强与超分辨率的端到端联合优化，其创新性体现在：将物理模型深度嵌入Transformer架构，通过MCA和DATB解决传统方法中通道信息丢失与空间特征提取不足的缺陷；CPTB模块开创性地利用传输图引导注意力计算，为复杂光学环境下的图像恢复提供新范式。该方法在保持模型轻量化（仅1.2M参数）的同时，在UIEB数据集上达到0.91的UIQM分数，较次优方法降低37%推理耗时，显著提升水下机器人实时视觉的可靠性。论文成果发表于《Displays》，为海洋科考、水下考古等领域的视觉系统开发奠定理论基础。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号