检索增强图像协调(Raiha):基于外部参考与语义引导融合的视觉一致性优化框架
【字体:
大
中
小
】
时间:2025年10月13日
来源:Pattern Recognition 7.6
编辑推荐:
本文提出检索增强图像协调(Raiha)框架,通过检索外部参考图像解决背景缺乏相似内容时的协调难题,结合语义引导融合模块(Semantic-Guided Fusion)与数据增强策略,显著提升前景与背景的亮度、颜色一致性,为复杂摄影条件下的图像合成提供可靠解决方案。
Image Harmonization(图像协调技术)
传统方法通常依赖手工统计特征调整前景外观,但在复杂场景中表现有限。基于深度学习的方法通过数据驱动方式学习转换映射,例如DoveNet预测密集到密集的转换,部分研究还探索了高分辨率协调技术,包括可解释滤镜学习、分段曲线映射和RGB到RGB转换。
Overall Framework(整体框架设计)
针对现有方法在缺乏可靠参考时效果下降以及注意力机制不精准的问题,Raiha框架包含两个核心部分:用于获取合适参考图像的检索流程,以及配备语义引导融合模块的协调网络。该模块复用检索阶段提取的DVT特征,将注意力限制在语义相似区域,有效抑制无关区域干扰。
基于广泛使用的iHarmony4数据集(包含73,146个图像对),我们构建了RAHarmony4基准数据集,以支持检索增强协调任务的公平评估。数据集涵盖HAdobe5k、HFlickr、HCOCO和Hday2night子集,每个样本包含目标图像、前景掩码和合成图像。
Raiha通过检索外部参考图像解决了背景缺乏相似内容时的协调瓶颈,其检索策略确保参考图像同时满足光照一致性与内容相关性。结合语义引导融合模块与数据增强策略,该方法在协调任务中实现了最先进的性能,为复杂视觉一致性需求提供了创新解决方案。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号