隧道极端曝光图像动态范围压缩双域注意力网络:提升交通视觉系统的实时高精度增强

【字体: 时间:2025年06月27日 来源:Green Energy and Intelligent Transportation CS6.4

编辑推荐:

  为解决隧道场景中"黑洞"和"白洞"效应导致的图像动态范围失衡问题,研究人员提出动态范围压缩双域注意力网络(DRC-DFANet),集成动态频域注意力模块(DFAM)和空间自校准卷积(SCConv),实现PSNR提升8.8%,高频能量比(HFER)达1.26,为自动驾驶和交通监控提供实时高精度图像增强方案。

  

在快速发展的交通基础设施中,隧道场景的极端光照条件如同视觉系统的"阿喀琉斯之踵"——入口处刺眼的"白洞"过曝与内部昏暗的"黑洞"欠曝形成强烈反差,导致车载摄像头捕捉的图像丢失关键细节,危及自动驾驶安全。这种现象不仅让交通标志、车道线在图像中"消失",更可能因瞬间强光造成驾驶员视觉盲区。传统方法如Retinex模型和改进的Wavelet-SRNet虽各有所长,却难以兼顾全局光照协调与局部细节恢复,而生成模型如扩散模型又面临实时性挑战。

针对这一技术瓶颈,长安大学的研究团队在《Green Energy and Intelligent Transportation》发表研究,提出动态范围压缩双域注意力网络(DRC-DFANet)。该研究通过三个关键技术突破:基于Haar小波变换的动态频域注意力模块(DFAM)实现亮度-纹理解耦,空间自校准卷积(SCConv)建立通道-空间维度互作,以及四级特征金字塔实现多尺度渐进增强。实验采用Tunnel-VReID和温州高丽高速隧道数据集,通过三阶段渐进训练策略(128×128至512×512分辨率)优化模型。

研究结果部分,动态频域注意力模块(DFAM)通过小波变换将特征分解为低频(LL)和高频(LH/HL/HH)子带,采用可学习的Sigmoid函数动态调整亮度分布(γ~N(1.2,0.1)),使高频能量比(HFER)提升58.9%。空间自校准卷积(SCConv)通过双路径结构(3×3卷积主路径与通道注意力辅助路径)将PSNR提高3.4%,处理速度达42.65 FPS。多尺度架构验证显示,四级金字塔在PSNR(22.31 dB)与FPS(43.65)间取得最优平衡。

在隧道入口"黑洞"场景中,模型使混凝土墙面纹理重现,车牌边缘识别率提升;出口"白洞"区域的车道线恢复使检测置信度从0.46跃升至0.78。下游任务测试表明,经DRC-DFANet增强的图像使YOLOv8的召回率从61.2%提升至89.5%,误检率降低4.7%。非隧道场景(如高架桥低照度图像)的泛化测试进一步验证了模型的适应性。

该研究的突破性在于首次将频域动态压缩与空间自校准机制协同优化,通过γ参数正则化(L1+L2约束)实现亮度-细节的精准调控。尽管当前网络复杂度可能限制微型设备部署,但提出的双域协作框架为交通视觉系统提供了新范式。未来通过神经架构搜索(NAS)优化模块组合,或可进一步平衡性能与效率,推动该技术在车路协同与智慧城市监测中的应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号