基于双注意力机制的增强型流式图像水印技术

《Pattern Recognition》:Enhanced Flow-Based Image Watermarking with Dual Attention Mechanisms

【字体: 时间:2026年02月15日 来源:Pattern Recognition 7.6

编辑推荐:

  本文提出DARIW框架,通过通道注意力和焦点频率损失优化流式结构,增强水印鲁棒性及图像隐蔽性。实验证明其优于现有方法。

  
张国富|李欣|苏照平|方涵|连晨曦|王念松
合肥工业大学计算机科学与信息工程学院,中国合肥230601

摘要

近年来,基于深度学习的图像水印技术引起了广泛的研究兴趣。在各种开发的框架中,基于流的架构在平衡水印的不可察觉性和鲁棒性方面展现了显著的潜力。然而,现有的基于流的方法通常对所有内部特征应用相同的注意力——我们认为这种设计并不理想。鉴于对鲁棒性的需求以及图像内容的多样性,我们认为应该根据不同的特征重要性进行适应性加权。为了解决这个问题,我们提出了一个双重注意力增强的基于流的鲁棒图像水印(DARIW)框架。具体来说,我们的方法包含两个关键创新:首先,我们引入了一个通道注意力机制,该机制能够自适应地增强信息特征的贡献,同时抑制不太相关的特征。在这个模块中,我们使用了SiLU激活函数来加速网络收敛。这种设计有效地适应了不同图像区域之间的局部特征变化。其次,为了在空间域和频率域都加强注意力,我们采用了焦点频率损失,并进一步设计了一个多维低频损失函数,从而显著提高了水印图像的视觉质量。我们进行了全面的实验,将DARIW与几种最先进的深度水印方法进行了比较。结果验证了我们的方法在鲁棒性和保真度方面都取得了优越的性能。

引言

在数字时代,图像的广泛使用和传播引发了人们对版权侵犯的日益关注。为了保护知识产权并防止相关纠纷,鲁棒图像水印(RIW)[1]——一种将不可察觉但可识别的信息嵌入到宿主图像中以供后续验证和追踪的技术——吸引了大量的研究关注。然而,在实际应用中的一个主要挑战是确保对各种恶意或非故意攻击的鲁棒性[2],[3],这些攻击可能会破坏嵌入的水印,导致认证失败。因此,提高鲁棒性已成为数字水印研究中的一个核心问题[4]。
传统的RIW方法大致分为空间域方法和变换域方法,每种方法都表现出不同的鲁棒性特征[5]。空间域技术直接修改像素值——例如,最低有效位(LSB)替换[6],这是一种基本方法,其中图像像素的LSB被水印数据替换。相比之下,变换域方法将水印嵌入到其他表示中,如离散傅里叶变换(DFT)[7]、离散余弦变换(DCT)[8]或离散小波变换(DWT)[9]产生的表示中。一些研究进一步结合了多种变换,以利用混合域的独特属性,从而增强整体鲁棒性[10],[11]。
随着深度学习的快速发展,数据驱动的水印技术已成为提高鲁棒性和不可察觉性的强大框架[12]。典型的深度水印系统由三个核心组件组成:编码器、解码器和模拟噪声层。通过共同训练这些部分,模型可以学习对畸变的固有鲁棒性[13],[14]。然而,许多此类方法忽略了编码器和解码器之间的耦合关系,这可能导致嵌入和提取与水印无关的特征,最终降低性能。最近,方等人[15]引入了一个基于流的RIW网络(FBRIW),该网络使用共享的架构进行编码和解码,从而增强了结构一致性。然而,应该注意的是,FBRIW对所有中间特征都应用了相同的注意力。受此设计的启发,李等人[16]将基于流的框架改编用于图像隐写,实现了更高的隐蔽能力。
尽管现有的深度水印方法在实证上具有可行性,但它们仍然存在几个局限性。首先,它们在多种攻击场景下往往缺乏适应性鲁棒性。其次,编码器和解码器之间的耦合不足可能会在水印嵌入过程中引入冗余。第三,它们通常对所有特征赋予相同的权重,忽略了图像内容的不同特征以及不同鲁棒性级别的需求。鉴于图像和应用需求的多样性,需要更灵活的特征分配策略来实现自适应的水印性能。这些实际挑战突显了需要更全面和更具弹性的解决方案。
为了解决这些问题,本文提出了一个双重注意力增强的基于流的鲁棒图像水印框架,称为DARIW。我们的目标是通过集成双重注意力机制来增强基于流的水印架构,从而克服FBRIW对特征统一处理的限制。这项工作的主要贡献总结如下:
1) 我们在基于流的架构中引入了一个通道注意力机制[17],具体是在ρ模块中。与FBRIW不同,FBRIW对所有特征通道应用相同的权重,我们的DARIW通过挤压-激发操作自适应地重新校准特征的重要性。这进一步通过使用SiLU激活函数[18]进行了优化,该函数可以缓解梯度问题并加速收敛。这种增强使模型能够动态地强调与水印相关的特征,同时抑制不相关的特征,从而提高对不同图像内容的适应性。
2) 我们设计了一个双域优化框架,将焦点频率损失[19]与定制的多维低频损失结合起来。虽然FBRIW仅依赖于空间域损失,但我们的方法同时优化了空间域和频率域。焦点频率损失优先考虑难以重建的组件,而随机高斯低频损失增强了鲁棒性和视觉质量。这种双域策略显著提高了水印图像的不可见性和感知质量。
3) 这些双重注意力机制的整合增强了适应性和泛化能力。DARIW能够更有效地将水印嵌入到复杂的纹理区域,提高了对常见和未见攻击的抵抗力。广泛的实验表明,DARIW在鲁棒性和保真度方面优于FBRIW和其他最先进的方法,证实了其在实际场景中的优越泛化能力。
本文的其余部分组织如下。第2节回顾了与RIW相关的工作。第3节详细阐述了所提出的DARIW框架及其核心组件和设计原理。第4节展示了实验结果和比较分析。最后,第5节总结了本文并讨论了潜在的未来发展方向。

部分片段

相关工作

近年来,几项综述研究全面调查了RIW领域[12]。本节特别关注与我们的工作相关的端到端深度学习水印方法。
据我们所知,朱等人[20]率先使用生成对抗网络(GAN)提出了端到端RIW方法。他们的模型HiDDeN共同优化了一个生成视觉上无法区分的水印图像的编码器和一个恢复嵌入信息的解码器。

提出的DARIW网络

在本文中,我们提出了一个双重注意力增强的基于流的鲁棒图像水印网络,称为DARIW。我们首先回顾了[15]中介绍的基础基于流的架构。然后,我们引入了两个关键增强:首先是一个通道注意力机制,它自适应地重新校准特征重要性以强调语义相关的区域;其次是一个重构的损失函数,它共同优化了空间域和频率域的保真度,以提高不可察觉性

实验结果与分析

本节对提出的DARIW框架进行了全面评估。我们通过一系列实验将其性能与几种最先进的深度水印方法进行了比较。首先介绍了实验设置,然后评估了水印的保真度、对各种攻击的鲁棒性,以及验证各个组件的消融研究。

结论

本文提出了一种带有双重注意力机制的基于流的新型水印框架,以解决图像中的局部特征变化问题。所提出的方法DARIW包含了一个用于自适应特征重新校准的通道注意力模块,以及一个在空间域和频率域都运行的双域优化策略。实验结果表明,DARIW在不可察觉性和鲁棒性方面取得了显著改进,证明了其在

CRediT作者贡献声明

张国富:监督、撰写-审阅与编辑、方法论。李欣:撰写-原始草稿、验证、软件。苏照平:方法论、调查、形式分析。方涵:撰写-审阅与编辑、方法论。连晨曦:资源、数据管理。王念松:资源、数据管理。

CRediT作者贡献声明

张国富:撰写 – 审阅与编辑、监督、方法论。李欣:撰写 – 原始草稿、验证、软件。苏照平:方法论、调查、形式分析。方涵:撰写 – 审阅与编辑、方法论。连晨曦:资源、数据管理。王念松:资源、数据管理。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。

致谢

本项工作得到了教育部(MOE)人文社会科学基金一般项目(项目编号24YJA870011)、安徽省自然科学基金(项目编号2208085MF166)和中央高校基本科研业务费(项目编号PA2025GDSK0078)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号