编辑推荐:
本文全面综述可逆数据隐藏(RDH)技术。通过对 Web of Science 数据的定量与定性分析,呈现其研究趋势、主要贡献者和技术分类,探讨应用领域,剖析各技术优劣,还指出研究局限并展望未来,为该领域研究提供参考。
研究背景
在数字媒体网络存储和传输日益增长的时代,信息安全愈发重要。密码学和数据隐藏是保障信息安全的两种主要方式,其中数据隐藏将敏感信息隐藏在载体媒体中。但传统数据隐藏方法不可逆,会对载体媒体造成永久性改变,无法恢复原始载体。
可逆数据隐藏(RDH)技术应运而生,它能在隐藏数据的同时恢复载体媒体,满足了诸多对信息安全和图像保存都有严格要求的应用场景。其一般框架是先对载体媒体预处理,生成位置图和辅助信息,再将秘密数据、位置图和辅助信息嵌入载体媒体,形成标记图像(或称为隐写图像)。接收方利用辅助信息可逆向提取出原始载体媒体和隐藏数据。
RDH 技术分类
- 频率域:该领域的 RDH 技术利用知名变换技术,如离散余弦变换(Discrete Cosine Transform)、离散小波变换(Discrete Wavelet Transform)、整数小波变换(Integer Wavelet Transform)等,将载体图像变换到频率域,然后选择合适的频率系数隐藏秘密数据,确保载体图像可逆。此类技术虽稳健,但变换步骤增加了复杂性和传输开销,且嵌入容量有限。
- 压缩域:此领域的 RDH 技术借助各种压缩方法,如无损压缩的 Lempel–Ziv-Welch 算法,以及有损压缩的向量量化(Vector Quantization,VQ)和绝对矩块截断编码(Absolute Moment Block Truncation Coding,AMBTC)等,对载体图像进行压缩生成压缩码,在其中嵌入秘密数据。有损压缩技术虽会使图像产生一定失真,但能提高数据隐藏容量,并保持可接受的图像质量。
- 空间域
- 普通文本 RDH:直接修改载体图像的像素强度,旨在最大化嵌入容量并最小化标记图像的失真。可进一步分为代码分多路复用、直方图修改、误差扩展、插值、对比度增强、可逆对抗样本等方法。
- 代码分多路复用:类似电信技术,用 Walsh Hadamard 矩阵生成的正交扩展序列表示秘密数据,嵌入数据互不干扰,有足够的嵌入容量和低失真。
- 直方图修改:根据像素强度绘制直方图,选择峰值 bins 作为扩展 bins 隐藏数据,其他 bins 相应移位。通常需嵌入辅助信息以在数据提取时逆向操作。
- 误差扩展:利用载体媒体的冗余和相关性隐藏信息,主要包括差分扩展(Difference Expansion,DE)、像素值排序(Pixel Value Ordering,PVO)和预测误差扩展(Prediction Error Expansion,PEE)。近年来,为提升 PEE 性能,开发了多种预测器,如差分预测器(Difference predictor,DP)、中值边缘检测预测器(median edge detection predictor,MEDP)等,还出现了预测误差排序(Prediction Error Ordering,PEO)方法。
- 插值:在数字图像处理尤其是医疗领域重要,能在嵌入秘密信息时对载体图像进行上采样,同时保留恢复原始图像的能力。常见插值方法有最近邻插值(Nearest Neighbor Interpolation,NNI)、邻域插值(Neighbor Interpolation,NMI)、双线性插值和双三次插值。
- 对比度增强(RDH with contrast enhancement,RDHCE):在嵌入数据时增强标记图像的对比度,对原始对比度差的图像很有价值,如医疗图像。主要通过直方图均衡化和直方图拉伸实现,前者增强全局对比度但可能引入失真,后者实现局部对比度增强且失真较小。
- 对抗样本:用于应对人工智能技术带来的隐私问题,如性别识别和面部识别。RDH 技术将对抗扰动嵌入图像,迷惑人工智能分类模型,同时保证授权用户能准确恢复原始图像。
- 加密图像中的 RDH(RDHEI):在嵌入数据前对载体图像加密,增强安全性。分为加密后腾出空间(Vacating Room After Encryption,VRAE)和加密前预留空间(Reserving Room Before Encryption,RRBE)两类,可灵活配置安全模式,具有高安全性和嵌入容量。
- 鲁棒 RDH(Robust RDH,RRDH):旨在抵抗有意或无意的失真或攻击,如压缩、滤波、噪声添加等。可分为基于变换、基于高有效位平面(higher significant bit plane,HSB)、基于几何不变矩、基于秘密共享和基于统计分布的 RRDH 技术。
RDH 的应用领域
- 版权保护:在水印技术中,RDH 可嵌入水印以保护数字媒体的版权,且能完整提取水印和恢复原始媒体。
- 医疗成像:随着数字医疗成像发展,RDH 能在不影响图像诊断完整性的前提下,嵌入患者的机密信息。
- 云存储:满足云存储中管理数据嵌入的需求,且不增加存储成本,确保数据完整性和存储效率,RDHEI 技术尤其适用于加密数据的云存储管理。
- 对抗样本:在人工智能隐私保护方面,RDH 嵌入对抗扰动保护个人数据,同时保证图像可用性。
- 隐蔽通信:广泛用于军事等隐蔽通信场景,使隐藏信息难以被视觉检测,还可验证载体媒体是否被篡改。
研究方法
- 数据来源与检索:使用 Web of Science 数据库,通过特定搜索策略获取相关数据。
- 数据收集与预处理:对数据集进行细化和验证。
- 分析工具与可视化:运用 VOSViewer、CiteSpace 和 Rawgraphs 等软件进行深入分析和可视化呈现。
研究结果
- 趋势分析:从年度出版趋势、逐年引用进展、主要研究领域、成果丰硕的国家和顶尖期刊等多视角分析出版物结构,突出该领域的关键突破和有影响力的论文。
- 合著模式分析:有效合作对研究成果意义重大,该部分深入探讨 RDH 研究中的各种合作维度。
- 共现分析:收集 Web of Science 上的大量关键词,利用 VosViewer 的分数计数功能,设定最小出现阈值,分析 RDH 研究文章中关键词的共现情况。
- 引文分析:引文分析是展示研究领域中各参与者关联的有效工具,通过引文计数可衡量研究论文或作者工作的影响力,帮助确定重要趋势、方法和研究结果。
研究结论
- RDH 研究始于 2004 年,当年仅有 11 篇出版物,此后研究人员的兴趣持续增长,2022 年达到 236 篇。
- 2004 - 2024 年期间,Web of Science 上每年约发表 101 篇相关文章,共 2013 篇出版物推动了 RDH 的发展。
- 平均每篇文档被引用 25 次,总引用次数反映了该领域研究的影响力。
研究局限
尽管本研究覆盖面广,但部分 RDH 领域可能代表性不足,尤其是研究较少的领域。研究还受数据可用性和文献调查范围限制,可能无法完全涵盖最新进展和新兴趋势,这表明仍需持续研究以填补空白,深化对 RDH 的理解。