基于多注意力机制融合与复合损失函数优化的红外图像彩色化生成对抗网络
《Digital Signal Processing》:Infrared image color generation adversarial network based on the fusion of the multi-attention mechanism and the optimization of composite loss function
【字体:
大
中
小
】
时间:2025年10月28日
来源:Digital Signal Processing 3
编辑推荐:
本文提出了一种融合自注意力、通道注意力和空间注意力的生成对抗网络(GAN),通过精心设计的生成器和复合判别器结构提取多维特征信息,结合感知损失(Perception loss)和总变差损失(TV loss)优化生成效果。实验表明该方法在KAIST和IRVI数据集上能有效解决红外图像彩色化过程中的细节模糊和边缘不一致问题,生成更符合视觉感知的彩色图像。
本研究提出了一种创新性的红外图像彩色化方法,通过融合自注意力模块与通道-空间注意力机制(CBAM),显著提升了生成图像细节清晰度和边缘一致性。精心设计的瓶颈注意力(Bottleneck Attention)残差结构有效降低了计算成本,而复合判别器与融合感知损失+TV损失的组合进一步优化了色彩自然度和边界平滑性。在KAIST和IRVI数据集上的大量实验证实,本方法在视觉保真度和定量指标上均优于现有主流模型。
生成对抗网络(GAN)作为一种经典的机器学习模型,最初由Goodfellow等人提出,现已广泛应用于计算机视觉领域。在红外图像彩色化任务中,CycleGAN采用两对生成器-判别器结构:通过生成器G(x)将输入图像x转换为目标域的伪图像,再利用判别器D(G(x))判断其真实性概率。
本节详细介绍了实验所使用的两个公开数据集(KAIST和IRVI),简要说明了训练集与测试集的划分方式,并对实验环境配置、参数设置及结果进行了系统性分析,以验证本模型框架的优越性。
针对红外图像彩色化中存在的细节信息模糊和边缘一致性不足问题,我们开发了融合自注意力模块与多机制(通道注意力+空间注意力)的生成模型。相比基线模型,该方法在红外图像多维特征提取与转换方面表现出更优性能。所设计的复合判别器结构不仅提升了生成图像与真实图像之间的区分能力,还通过反馈约束生成器产生更逼真的彩色图像。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号