
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于自适应频率选择Transformer网络的低光照图像增强方法研究
【字体: 大 中 小 】 时间:2025年06月28日 来源:Displays 3.7
编辑推荐:
针对低光照图像增强(LLIE)中高频信息提取不足导致的细节丢失和伪影问题,研究人员提出自适应频率选择网络(AFSNet)。该网络通过频率选择Transformer(FSFormer)的双分支注意力模块(DBAM),结合语义分支的多深度卷积头转置注意力(MDTA)和频率分支的双重频率调制模块(DFMM),实现了区域自适应的频率分解与增强。实验表明该方法在合成与真实数据集上均优于现有技术(SOTA),为医学影像分析等领域提供了重要技术支撑。
在数字图像处理领域,低光照条件导致的图像质量退化一直是亟待解决的难题。当环境光照不足时,获取的图像往往存在对比度降低、噪声增加和细节丢失等问题,严重影响后续的医学诊断、自动驾驶等关键应用。尽管基于Retinex理论的传统方法和卷积神经网络(CNN)取得了一定进展,但前者易产生低对比度问题,后者难以捕捉长程依赖关系。近年来Transformer模型虽展现出优势,却仍面临高频信息利用不足的瓶颈,导致增强后的图像出现边缘模糊和伪影。
针对这一挑战,上海理工大学的研究团队在《Displays》发表论文,提出了一种突破性的自适应频率选择网络(AFSNet)。该研究创新性地将频率分析与Transformer架构相结合,通过设计的频率选择Transformer(FSFormer)模块,实现了对图像不同频率成分的精准调控。核心的双分支注意力模块(DBAM)能同时捕获全局语义和局部频率特征,配合创新的频率感知特征融合(Freqfusion)机制,显著提升了低光照图像的增强效果。实验证明该方法在LOL、MIT-Adobe FiveK等数据集上PSNR和SSIM指标均优于现有方法,尤其在保留纹理细节和抑制噪声方面表现突出。
关键技术包括:1)基于U-Net架构构建多尺度特征提取框架;2)设计双分支注意力模块(DBAM)整合语义分支(MDTA)和频率分支(DFMM);3)区域自适应频率分解(RAFD)模块实现动态频率选择;4)使用合成与真实低光照数据集(LOL、MIT-Adobe FiveK等)进行模型训练与验证。
网络框架
研究团队构建的AFSNet采用编码器-解码器结构,核心创新是FSFormer模块。该模块通过DBAM同时处理空间语义和频率特征:语义分支采用多深度卷积头转置注意力(MDTA)捕获长程依赖;频率分支通过双重频率调制模块(DFMM)实现高频/低频成分的差异化增强。频率感知特征融合(Freqfusion)模块则有效整合了不同尺度的特征。
实验
在LOL-v2、MIT-Adobe FiveK等数据集上的定量评估显示,AFSNet的PSNR达到23.56dB,SSIM为0.892,均优于对比方法。视觉对比表明,该方法在极端暗光、背光等复杂场景下能更好保留血管纹理等细微结构,且噪声抑制效果显著。消融实验验证了DBAM和Freqfusion模块的贡献率分别达37.2%和28.5%。
结论
该研究提出的AFSNet通过创新的频率调制策略,解决了现有低光照增强方法在频率选择自适应性和特征融合效率方面的局限。DBAM模块的语义-频率双通路设计,以及RAFD实现的动态频率分解,为医学影像、遥感监测等需要高精度图像复原的领域提供了新思路。研究团队指出,未来将进一步优化模型在移动端的计算效率,并探索其在内窥镜影像增强等医疗场景的应用潜力。
生物通微信公众号
知名企业招聘