
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于四元数卷积的轻量化低光照图像增强网络QLight-Net
【字体: 大 中 小 】 时间:2025年06月13日 来源:Journal of Visual Communication and Image Representation 2.6
编辑推荐:
针对低光照图像存在的色彩失真、噪声放大及传统方法参数量大等问题,研究人员提出基于四元数代数(Quaternion)的轻量化网络QLight-Net。通过深度可分离四元数卷积(DW-QConv)和双分支架构(梯度分支与色彩分支),在LPIPS(0.047)、SSIM(0.88)和PSNR(29.05)指标上超越现有方法,实现了计算效率与增强效果的平衡。
在数字成像技术飞速发展的今天,从军事监控到自动驾驶,低光照环境下的图像质量直接影响决策准确性。然而,现有增强方法往往陷入两难境地:要么如RetinexNet等传统模型通过复杂网络结构提升亮度却引入噪声,要么如LLNet等轻量化模型牺牲细节保效率。更棘手的是,基于实数空间的卷积操作导致参数量膨胀,而梯度与色彩特征的交互建模不足又造成色彩失真。这些问题严重制约了算法在边缘设备(如车载摄像头)的落地应用。
为此,研究人员提出革命性的QLight-Net框架,其核心创新在于将四元数代数(Quaternion)引入低光照增强领域。四元数的哈密顿乘积特性可高效编码多通道特征,而团队进一步开发的深度可分离四元数卷积(DW-QConv)较传统QCNN减少30%参数量。模型采用双分支架构:梯度分支通过Sobel算子提取边缘特征,色彩分支利用四元数交叉注意力(Quaternion Cross-Attention)捕捉通道间依赖关系。两分支特征在解码阶段通过门控机制动态融合,最终在LOLv1/v2数据集上实现LPIPS 0.047的突破性成绩——这意味着增强图像与真实样本的感知差异降低42%。该成果发表于《Journal of Visual Communication and Image Representation》。
关键技术包括:1)基于LOLv1/v2数据集(含合成与真实低光图像)的对抗训练;2)深度可分离四元数卷积层设计;3)梯度-色彩双分支特征提取;4)四元数空间下的交叉注意力机制。
研究结果部分显示:
梯度分支通过改进的Sobel算子提取方向敏感特征,实验表明该设计使边缘保持指标(EPI)提升19%;
色彩分支采用四元数多头注意力,在CIE-Lab色彩空间下ΔE00
色差降低至2.3;
参数效率方面,模型仅需1.7M参数,推理速度达45FPS@1080p,较RetinexNet提速8倍;
消融实验证实DW-QConv使FLOPs减少62%,而双分支结构贡献了70%的SSIM提升。
结论指出,QLight-Net首次将四元数卷积与注意力机制结合,通过数学形式化方法解决了低光照增强中的"效率-效果"悖论。其DW-QConv设计为轻量化网络提供新范式,而梯度-色彩协同机制为多特征融合树立标杆。该技术已应用于某车企夜视系统,误检率降低37%。未来可扩展至医学影像增强等领域,但需进一步解决极端噪声(ISO>12800)下的稳定性问题。
生物通微信公众号
知名企业招聘