在数字时代,图像的广泛使用和传播引发了人们对版权侵犯的日益关注。为了保护知识产权并防止相关纠纷,鲁棒图像水印(RIW)[1]——一种将不可察觉但可识别的信息嵌入到宿主图像中以供后续验证和追踪的技术——吸引了大量的研究关注。然而,在实际应用中的一个主要挑战是确保对各种恶意或非故意攻击的鲁棒性[2],[3],这些攻击可能会破坏嵌入的水印,导致认证失败。因此,提高鲁棒性已成为数字水印研究中的一个核心问题[4]。
传统的RIW方法大致分为空间域方法和变换域方法,每种方法都表现出不同的鲁棒性特征[5]。空间域技术直接修改像素值——例如,最低有效位(LSB)替换[6],这是一种基本方法,其中图像像素的LSB被水印数据替换。相比之下,变换域方法将水印嵌入到其他表示中,如离散傅里叶变换(DFT)[7]、离散余弦变换(DCT)[8]或离散小波变换(DWT)[9]产生的表示中。一些研究进一步结合了多种变换,以利用混合域的独特属性,从而增强整体鲁棒性[10],[11]。
随着深度学习的快速发展,数据驱动的水印技术已成为提高鲁棒性和不可察觉性的强大框架[12]。典型的深度水印系统由三个核心组件组成:编码器、解码器和模拟噪声层。通过共同训练这些部分,模型可以学习对畸变的固有鲁棒性[13],[14]。然而,许多此类方法忽略了编码器和解码器之间的耦合关系,这可能导致嵌入和提取与水印无关的特征,最终降低性能。最近,方等人[15]引入了一个基于流的RIW网络(FBRIW),该网络使用共享的架构进行编码和解码,从而增强了结构一致性。然而,应该注意的是,FBRIW对所有中间特征都应用了相同的注意力。受此设计的启发,李等人[16]将基于流的框架改编用于图像隐写,实现了更高的隐蔽能力。
尽管现有的深度水印方法在实证上具有可行性,但它们仍然存在几个局限性。首先,它们在多种攻击场景下往往缺乏适应性鲁棒性。其次,编码器和解码器之间的耦合不足可能会在水印嵌入过程中引入冗余。第三,它们通常对所有特征赋予相同的权重,忽略了图像内容的不同特征以及不同鲁棒性级别的需求。鉴于图像和应用需求的多样性,需要更灵活的特征分配策略来实现自适应的水印性能。这些实际挑战突显了需要更全面和更具弹性的解决方案。
为了解决这些问题,本文提出了一个双重注意力增强的基于流的鲁棒图像水印框架,称为DARIW。我们的目标是通过集成双重注意力机制来增强基于流的水印架构,从而克服FBRIW对特征统一处理的限制。这项工作的主要贡献总结如下:
1) 我们在基于流的架构中引入了一个通道注意力机制[17],具体是在ρ模块中。与FBRIW不同,FBRIW对所有特征通道应用相同的权重,我们的DARIW通过挤压-激发操作自适应地重新校准特征的重要性。这进一步通过使用SiLU激活函数[18]进行了优化,该函数可以缓解梯度问题并加速收敛。这种增强使模型能够动态地强调与水印相关的特征,同时抑制不相关的特征,从而提高对不同图像内容的适应性。
2) 我们设计了一个双域优化框架,将焦点频率损失[19]与定制的多维低频损失结合起来。虽然FBRIW仅依赖于空间域损失,但我们的方法同时优化了空间域和频率域。焦点频率损失优先考虑难以重建的组件,而随机高斯低频损失增强了鲁棒性和视觉质量。这种双域策略显著提高了水印图像的不可见性和感知质量。
3) 这些双重注意力机制的整合增强了适应性和泛化能力。DARIW能够更有效地将水印嵌入到复杂的纹理区域,提高了对常见和未见攻击的抵抗力。广泛的实验表明,DARIW在鲁棒性和保真度方面优于FBRIW和其他最先进的方法,证实了其在实际场景中的优越泛化能力。
本文的其余部分组织如下。第2节回顾了与RIW相关的工作。第3节详细阐述了所提出的DARIW框架及其核心组件和设计原理。第4节展示了实验结果和比较分析。最后,第5节总结了本文并讨论了潜在的未来发展方向。