
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于视图重叠策略(VOS)的热红外图像着色方法研究:提升色彩准确性与边缘保持的新范式
【字体: 大 中 小 】 时间:2025年06月29日 来源:Neurocomputing 5.5
编辑推荐:
为解决热红外图像着色过程中纹理自然转换和色彩准确性不足的难题,研究人员提出了一种创新的视图重叠策略(VOS)。该研究通过双分支生成器和滑动机制设计,结合最优对抗策略(OAS)和步长损失函数,显著改善了边缘扭曲和色彩失真问题。实验表明,VOS在FLIR和KAIST数据集上实现了更清晰的色彩还原和更真实的视觉效果,为红外图像在军事、消防等领域的应用提供了新的技术路径。
热红外成像技术因其在黑暗环境中的成像能力,被广泛应用于军事侦察、消防救援等领域。然而,传统热红外图像以灰度或伪彩色呈现,缺乏丰富的色彩信息,严重影响了人眼对图像的直观理解和细节辨识。现有着色方法如AHTIC-Net和Pix2pix虽取得一定进展,但仍面临色彩失真、边缘模糊等挑战,特别是难以建立符合人类视觉感知的色彩映射关系。
针对这一难题,国内某研究机构在《Neurocomputing》发表论文,提出基于视图重叠策略(VOS)的创新方法。该研究通过设计双分支生成器架构和动态滑动机制,结合最优对抗策略(OAS)评估机制,实现了热红外图像的高精度色彩还原。关键技术包括:1)视图重叠区域分割技术,将输入图像划分为I、II、III三个特征区域;2)双分支生成器对抗训练框架,通过步长损失(Lstep)和分割像素损失(Lsl)联合优化;3)基于FLIR和KAIST数据集的定量评估体系。
3.1 引言部分
研究指出传统方法如CycleGAN和CUT在色彩约束上的不足,而VOS通过引入人类双目视觉重叠原理,在区域II建立色彩传递的"黄金标准"。理论分析表明,当重叠区域宽度为图像宽度1/3时,能最优平衡色彩一致性与细节保留。
3.2 方法部分
3.2.1 VOS核心设计
系统将输入图像x通过分割线l1和l2划分为三个区域,其中区域II(l1→l2)为关键重叠区。通过双生成器G1和G2分别处理不同区域,并采用R变换统一特征维度,实现多尺度特征融合。
3.2.2 分割区域变换
提出基于双三次插值的动态尺寸调整方法,定义缩放因子?1Wi=Wi/l2,确保不同尺寸输入的统一处理。实验显示当?l1=Wi/l2时,色彩映射误差降低37.5%。
3.2.3 步长变换
创新性地引入动态步长ls机制,通过最优步长lsbest调整区域重叠比例。当E1>E2时,步长损失Lstepx2优先优化G2生成质量。
3.3 损失函数
3.3.1 分割像素损失
构建四分量损失函数:Lsl=LI*x1+LII*x1+LII*x2+LIII*x2,其中LII*x1采用L1范数约束重叠区域色彩一致性。
3.3.2 步长损失
设计条件式损失函数,当G2为最优生成器时,Lstepx1=0,Lstepx2采用L2范数约束,实验表明该设计使PSNR提升2.1dB。
研究结论表明,VOS方法在FLIR数据集上相比基线模型色彩准确度提升29.7%,边缘保持指数(EPI)提高41.3%。该技术为夜视监控、医疗热成像等领域的图像增强提供了新思路,特别是其提出的动态重叠区域优化策略,为跨模态图像转换研究开辟了新方向。讨论部分强调,OAS机制有效解决了传统GAN训练不稳定的问题,而步长损失的引入则突破了固定数据集训练的局限性,使模型能自适应学习渐进式色彩特征。
生物通微信公众号
知名企业招聘