LIVFusion:基于小波 Transformer 的亮度优化红外与可见光图像融合方法

【字体: 时间:2025年05月27日 来源:Engineering Applications of Artificial Intelligence 7.5

编辑推荐:

  在图像处理中,红外与可见光图像有效融合,尤其在光照调整和细节保留方面颇具挑战。研究人员开展 LIVFusion 框架研究,融合 SIDNet 与 WTFNet,引入对比均衡损失。结果显示其性能优于现有技术,对夜间图像分析等应用意义重大。

  
在计算机视觉领域,图像融合如同搭建不同成像世界的桥梁,让单一模态图像难以捕捉的信息得以互补呈现。红外图像如同黑夜中的 “热眼”,能穿透黑暗捕捉物体的温度信息,而可见光图像则如白昼的 “明眸”,细腻展现纹理与色彩。然而,当夜幕降临或光线昏暗时,可见光图像会因光照不足变得模糊、色彩失真,现有融合方法往往难以在光照调整与细节保留间取得平衡,要么让融合图像亮度失衡,要么丢失关键纹理,导致后续如军事 surveillance、target detection 等应用效果大打折扣。如何让红外与可见光图像在低光下 “珠联璧合”,成为亟待攻克的难题。

为破解这一困局,国内研究人员开展了相关研究,成果发表在《Engineering Applications of Artificial Intelligence》。他们提出 LIVFusion 框架,致力于实现低光环境下红外与可见光图像的高质量融合,提升图像在复杂光照条件下的实用性。

研究人员采用了两项关键技术:一是场景光照解缠网络(SIDNet),它结合 Retinex 理论与通道注意力机制,如同 “光照调音师”,能有效分离退化的光照,增强关键特征提取,生成红外特征与增强后的可见光特征;二是小波 Transformer 融合网络(WTFNet),其借助离散小波变换(DWT)对图像进行多尺度分解,将图像分为低频特征(如形状、轮廓)与高频细节(如纹理、边缘),再利用 Transformer 的多头注意力机制,像 “特征放大镜” 一样聚焦不同尺度的重要特征,实现从多尺度特征提取到合成的优化。此外,研究还引入对比均衡损失函数,通过调整全局与局部对比度,解决光照增强带来的色彩失真问题,让融合图像的色彩更逼真、细节更清晰。

实验验证与结果


研究在多个数据集上开展实验,通过与十种先进的深度学习方法对比,验证 LIVFusion 的性能。

  • 多尺度特征融合效果:WTFNet 的小波变换与多头注意力机制结合,使融合图像在保留整体结构的同时,显著提升纹理细节的清晰度,如在低光场景下能清晰呈现物体的边缘与表面纹路,优于传统基于卷积神经网络(CNN)和自动编码器(AE)的方法。
  • 光照调整与色彩保真:SIDNet 的引入有效改善了低光下可见光图像的光照退化问题,结合对比均衡损失,融合图像的亮度分布更均匀,色彩失真显著减少,在色彩保真度指标上优于基于生成对抗网络(GAN)的融合方法。
  • 综合性能评估:定量指标显示,LIVFusion 在峰值信噪比(PSNR)、结构相似性指数(SSIM)等关键性能指标上均显著优于现有先进技术(SOTA),证明其在低光环境下红外与可见光图像融合中的优越性。

结论与意义


LIVFusion 通过 SIDNet 与 WTFNet 的协同作用,构建了双阶段深度学习模型,成功攻克了低光环境下红外与可见光图像融合中光照不均与细节丢失的难题。对比均衡损失函数的设计,进一步提升了复杂光照下图像的对比度与色彩准确性。该研究为夜间监控、灾害救援等依赖低光图像分析的领域提供了更高效的解决方案,推动了多模态图像融合技术在实际场景中的应用与发展。其创新的融合框架与技术思路,也为后续图像融合研究提供了新的方向与参考,有望在计算机视觉领域引发更多基于深度学习与传统信号处理结合的突破性成果。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号