基于双交叉注意力Transformer的低光照图像增强方法ECAFormer及其在交通场景中的应用

【字体: 时间:2025年07月03日 来源:Engineering Applications of Artificial Intelligence 7.5

编辑推荐:

  针对低光照图像增强(LLIE)中局部自相似性与长程依赖难以兼顾导致细节丢失的问题,研究人员提出层次化互增强框架ECAFormer,通过双多头自注意力(DMSA)模块实现视觉-语义特征解耦与跨尺度交互,在五个基准数据集上PSNR指标提升3.7%,并构建Traffic-297交通场景数据集,为自动驾驶与夜间监控提供新解决方案。

  

在计算机视觉领域,低光照环境下的图像采集长期面临细节模糊、色彩失真等挑战,直接影响自动驾驶和夜间监控等关键应用。尽管现有方法如基于Retinex理论的分解网络或两分支架构取得进展,但局部特征与全局依赖的协同建模仍是瓶颈,导致增强后的图像出现细节丢失或伪影。

针对这一难题,来自中国的研究团队在《Engineering Applications of Artificial Intelligence》发表研究,提出创新性解决方案ECAFormer。该工作核心在于构建层次化互增强框架,通过视觉-语义卷积模块生成多尺度特征,利用改进的双多头自注意力(DMSA)实现特征解耦与交互,并结合跨尺度DMSA(CSDMSA)模块强化残差连接。研究同步发布Traffic-297数据集,涵盖复杂交通场景的夜间图像。

关键技术包括:1) U型架构下嵌入DMSA模块实现视觉-语义特征协同优化;2) CSDMSA模块通过跨层残差连接捕获长程依赖;3) 构建包含297张图像的交通场景基准数据集。实验设计覆盖LOL-v1/v2、SID等五个公开数据集,采用PSNR等客观指标评估。

【主要结果】

  1. 模型性能:在LOL-v1数据集上PSNR达24.68dB,较次优方法提升3.7%,验证DMSA模块对特征互补的有效性。
  2. 消融实验:移除CSDMSA模块导致PSNR下降1.2dB,证实跨层信息整合对细节保留的关键作用。
  3. 新数据集验证:Traffic-297测试中,ECAFormer在动态模糊场景下仍保持2.4dB的PSNR优势。

【结论与意义】
该研究通过双交叉注意力机制创新性地解决了LLIE领域特征解耦与融合的平衡问题。ECAFormer的层次化设计既保留CNN的局部特征提取优势,又融合Transformer的全局建模能力,为复杂光照条件下的图像增强提供新范式。Traffic-297数据集的发布填补了交通场景评估空白,对自动驾驶系统在极端环境下的可靠性提升具有实践价值。未来工作可探索多模态传感器数据与ECAFormer的协同增强机制。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号