
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于对比学习的遥感影像高位深无监督转换方法研究
【字体: 大 中 小 】 时间:2025年06月13日 来源:Knowledge-Based Systems 7.2
编辑推荐:
针对高位深(>10bit)遥感影像向标准8bit格式转换时存在的自动化程度低、色彩异常及拼接接缝问题,研究团队创新性地提出融合生成对抗网络(GAN)与对比学习的无监督转换方法。通过热力学启发的Transformer生成器和直方图形状上下文对比损失,实现了高位深遥感影像的高保真压缩,结合混合直方图匹配后处理技术有效消除拼接接缝。该方法在自主构建的数据集上验证优于现有技术,为遥感影像预处理提供了新范式。
随着遥感传感器技术的进步,现代遥感影像普遍采用超过10位的高位深(HBI)存储格式,但实际应用中可视化、目标检测等场景仍依赖标准8位(SBI)图像。传统线性拉伸、百分比截断等方法需人工调参且易丢失细节,而现有基于深度学习的色调映射方法主要针对自然场景图像,存在数据格式不兼容、语义差异等问题。更棘手的是,遥感影像的尺度依赖性导致深度学习结果拼接时出现统计特征不连续的接缝现象。这些瓶颈严重制约了遥感影像处理的时效性和精度,亟需开发专用的位深转换技术。
针对这一挑战,Tengda Zhang等研究人员在《Knowledge-Based Systems》发表研究,提出融合生成对抗网络与对比学习的创新解决方案。研究团队创造性地将灰度值映射类比为热场粒子运动,构建基于热力学原理的Transformer生成器;利用高低位深图像直方图的相似特性,设计直方图形状上下文对比损失调控色彩分布;针对尺度依赖性问题,开发混合直方图匹配后处理方法。实验证明该方法在自主构建的吉林一号、高分七号等数据集上,转换效果显著优于现有方法。
关键技术方法包括:1) 热力学启发的三阶有限差分Transformer生成器设计;2) 直方图形状上下文对比损失函数;3) 混合直方图匹配后处理技术。数据集来自吉林一号(内蒙古通辽)、高分七号(辽宁朝阳)和高分二号(辽宁阜新)的遥感影像,涵盖不同量化值和空间分辨率。
【总体结构】研究采用两阶段框架:第一阶段通过GAN框架实现初步转换,生成器采用三阶有限差分模块增强编码能力;第二阶段采用混合直方图匹配消除拼接接缝。这种设计既保证单幅图像质量,又满足大场景无缝拼接需求。
【数据集构建】针对研究空白,团队构建了首个专门用于位深转换的遥感数据集,包含三种不同量化特性(12-16位)的影像,为方法验证提供基准。
【结论】该研究首次系统解决高位深遥感影像转换的三大难题:1) 热力学启发的生成器设计有效保持图像结构;2) 直方图对比损失确保色彩分布合理性;3) 混合直方图匹配成功消除拼接接缝。实验表明该方法PSNR比现有最佳方法提升2.1dB,SSIM提高0.15。
这项工作的科学价值在于:一方面,将物理模型(热力学)与深度学习相结合,为跨域图像转换提供了新思路;另一方面,针对遥感影像特有的尺度依赖性提出的后处理方案,对卫星影像处理管线具有重要实践意义。研究开源的代码和数据集(https://github.com/ZzzTD/Bit-depth_conversion)将推动该领域的后续发展。
生物通微信公众号
知名企业招聘