
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于双注意力与跨物理引导Transformer的水下图像同步增强与超分辨率重建方法研究
【字体: 大 中 小 】 时间:2025年06月30日 来源:Displays 3.7
编辑推荐:
针对水下图像因光散射/吸收导致的低分辨率、非均匀光照(NUI)等问题,研究人员提出DAPT-SESR方法,通过多头协方差注意力(MCA)、双注意力Transformer块(DATB)和跨物理引导Transformer块(CPTB),实现水下图像增强(UIE)与超分辨率(SR)的同步优化。实验表明该方法在定量与定性评估中均优于现有技术,为海洋探测提供高效视觉解决方案。
水下环境因其独特的光学特性成为视觉处理的重大挑战。光线在水中经历散射和吸收后,成像系统捕获的图像往往呈现低对比度、颜色失真和细节丢失。更棘手的是,辅助光源的使用导致非均匀光照(NUI)现象,而水下通信带宽限制又迫使图像采用低比特率传输,进一步加剧分辨率下降。传统方法通常将图像增强(UIE)与超分辨率(SR)分步处理,但UIE引入的噪声在SR阶段会被放大,且水下设备的有限算力难以支撑串联任务的实时需求。
针对这一系列问题,研究人员提出DAPT-SESR框架,首次将双注意力机制与物理先验融合引入Transformer架构。该研究通过三个核心创新点破解水下视觉难题:首先,针对水下光衰减不一致性设计的多头协方差注意力(MCA),通过计算通道特征的协方差矩阵动态补偿信息损失;其次,串联空间与通道Transformer构成的双注意力块(DATB),实现局部退化特征与全局上下文协同提取;最后,创新性利用传输图作为物理引导,通过跨物理引导Transformer块(CPTB)将退化图像与传输图交叉注意力计算,有效抑制NUI区域的过增强或欠增强现象。
关键技术方法
研究采用编码器-解码器结构,输入为3通道退化图像Xd∈R3×H×W与1通道传输图Xt∈R1×H×W,经CPTB融合为4通道特征。训练使用Adam优化器(β=0.9,0.999),初始学习率1e-3,采用余弦退火策略调整至2e-6。网络嵌入维度32,在NVIDIA RTX 3090上以batch size=16训练500轮次。
研究结果
结论与意义
DAPT-SESR首次实现水下图像增强与超分辨率的端到端联合优化,其创新性体现在:将物理模型深度嵌入Transformer架构,通过MCA和DATB解决传统方法中通道信息丢失与空间特征提取不足的缺陷;CPTB模块开创性地利用传输图引导注意力计算,为复杂光学环境下的图像恢复提供新范式。该方法在保持模型轻量化(仅1.2M参数)的同时,在UIEB数据集上达到0.91的UIQM分数,较次优方法降低37%推理耗时,显著提升水下机器人实时视觉的可靠性。论文成果发表于《Displays》,为海洋科考、水下考古等领域的视觉系统开发奠定理论基础。
生物通微信公众号
知名企业招聘