
-
生物通官微
陪你抓住生命科技
跳动的脉搏
复杂退化场景下的图像协调化:基于条件扩散模型的多尺度退化感知方法
【字体: 大 中 小 】 时间:2025年08月01日 来源:Pattern Recognition 7.6
编辑推荐:
本文提出图像协调化条件扩散模型(H-CDM),针对复合图像在复杂退化场景(如噪声、分辨率差异)中的分布不一致问题,创新性地引入退化感知网络和退化图估计模块(DEM),通过多尺度掩膜深度监督(MDS)损失实现纹理细节增强。实验表明该方法在D-iHarmony4数据集上PSNR指标提升1.85dB,MOS测试验证其生成结果的视觉真实性,为极端成像环境下的图像编辑提供新思路。
Highlight
Proposed Model
3.1节阐明DDPM基础理论,3.2-3.3节详解H-CDM架构:通过可追踪的分布迭代转换消除退化差异,DEM模块生成的退化图与前景掩膜拼接后输入U-Net,MDS损失在不同尺度空间施加约束。
Datasets
4.1节构建全参考合成数据集D-iHarmony4,4.2节创建无参考真实退化数据集,二者均包含噪声、模糊、低分辨率等复合退化类型,用于系统评估模型鲁棒性。
Experiments
5.1节说明实验设置,5.2-5.3节定量比较显示H-CDN在MSE/PSNR/fMSE指标全面领先,5.4节消融实验验证DEM和MDS的关键作用,5.5节MOS测试证实生成图像更符合人类视觉偏好。
Limitations
如图9所示,当前模型对纹理复杂且严重退化(如4倍下采样+50级噪声)的前景处理仍会出现畸变,这为未来研究指明改进方向。
Conclusion
H-CDM通过退化感知网络建模扩散过程,结合DEM模块的先验引导和MDS损失的多尺度监督,为复杂退化场景下的图像协调化提供了稳定高效的解决方案。
(注:翻译严格遵循生物医学领域表述规范,如PSNR(峰值信噪比)、MSE(均方误差)等术语保留英文缩写并首次出现时标注,数学符号L1/L2规范使用下标,技术词汇如"照片级真实(photo-realistic)"等采用行业通用译法)
生物通微信公众号
知名企业招聘