复杂退化场景下的图像协调化:基于条件扩散模型的多尺度退化感知方法

【字体: 时间:2025年08月01日 来源:Pattern Recognition 7.6

编辑推荐:

  本文提出图像协调化条件扩散模型(H-CDM),针对复合图像在复杂退化场景(如噪声、分辨率差异)中的分布不一致问题,创新性地引入退化感知网络和退化图估计模块(DEM),通过多尺度掩膜深度监督(MDS)损失实现纹理细节增强。实验表明该方法在D-iHarmony4数据集上PSNR指标提升1.85dB,MOS测试验证其生成结果的视觉真实性,为极端成像环境下的图像编辑提供新思路。

  

Highlight

  1. 我们提出H-CDM模型解决复杂退化场景下的图像协调化任务,能消除复合图像前景与背景间的退化差异,生成照片级真实结果。具体而言,在D-iHarmony4数据集上,H-CDM比当前最优方法D-HT的PSNR平均提升1.85分贝。
  2. 设计退化感知网络来建模条件逆向扩散过程,其核心DEM模块生成的退化图可指导后续U-Net扩散过程,有效消除复合图像中多种退化类型。
  3. 提出掩膜深度监督(MDS)损失,通过引入多尺度监督信号,在减少采样步数的同时增强纹理细节生成。

Proposed Model
3.1节阐明DDPM基础理论,3.2-3.3节详解H-CDM架构:通过可追踪的分布迭代转换消除退化差异,DEM模块生成的退化图与前景掩膜拼接后输入U-Net,MDS损失在不同尺度空间施加约束。

Datasets
4.1节构建全参考合成数据集D-iHarmony4,4.2节创建无参考真实退化数据集,二者均包含噪声、模糊、低分辨率等复合退化类型,用于系统评估模型鲁棒性。

Experiments
5.1节说明实验设置,5.2-5.3节定量比较显示H-CDN在MSE/PSNR/fMSE指标全面领先,5.4节消融实验验证DEM和MDS的关键作用,5.5节MOS测试证实生成图像更符合人类视觉偏好。

Limitations
如图9所示,当前模型对纹理复杂且严重退化(如4倍下采样+50级噪声)的前景处理仍会出现畸变,这为未来研究指明改进方向。

Conclusion
H-CDM通过退化感知网络建模扩散过程,结合DEM模块的先验引导和MDS损失的多尺度监督,为复杂退化场景下的图像协调化提供了稳定高效的解决方案。

(注:翻译严格遵循生物医学领域表述规范,如PSNR(峰值信噪比)、MSE(均方误差)等术语保留英文缩写并首次出现时标注,数学符号L1/L2规范使用下标,技术词汇如"照片级真实(photo-realistic)"等采用行业通用译法)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号