基于时序延迟自博弈学习的彩色图像感知哈希生成方法及其鲁棒性研究

【字体: 时间:2025年05月30日 来源:Expert Systems with Applications 7.5

编辑推荐:

  为解决互联网海量图像检索中内容敏感性和鲁棒性难以平衡的问题,研究人员提出了一种基于时序延迟自博弈学习(self-play with temporal delay)的感知哈希生成方法。通过CNN架构结合改进的sigmoid函数,在CIFAR-10等数据集上实现84.61%-89.2%的MAP值,显著提升哈希码对图像变换的鲁棒性,为CBIR系统提供了新思路。

  

随着互联网图像数据爆炸式增长,内容检索(CBIR)面临两大挑战:一是视觉内容相似的图像因微小变换(如旋转、压缩)被系统误判为不同样本;二是传统加密哈希对内容变化过度敏感。现有基于深度学习的感知哈希方法虽能提取图像特征,但存在量化误差和变换脆弱性问题。为此,研究人员提出了一种创新性解决方案——通过时序延迟自博弈训练机制优化特征空间聚类。

该研究由国内团队开展,采用卷积神经网络(CNN)架构,引入自博弈学习框架:网络将当前训练迭代的输出与历史权重生成的特征进行对比,动态调整相似图像的簇内距离和异类图像的簇间距离。为降低二值化过程中的量化损失,设计了一种高梯度改进型sigmoid函数。实验选用CIFAR-10、NUS-WIDE和FLickr25K数据集,通过交叉验证评估性能。

主要技术方法

  1. 时序延迟自博弈训练:通过比较当前网络与历史权重的特征输出,构建动态优化的特征空间
  2. 改进型sigmoid激活函数:增大梯度值以减少二值化误差
  3. 多数据集验证:采用15,000张训练图像和1,500张测试图像评估泛化能力
  4. 均值平均精度(MAP)指标:量化哈希码在83%-89.2%的识别准确率

研究结果

  • 特征空间优化:自博弈机制使相似图像特征距离缩小47%,异类图像特征距离扩大62%
  • 量化误差控制:改进型sigmoid函数降低二值化损失达32%,较tanh(βz)方案提升9个百分点
  • 跨数据集验证:在NUS-WIDE到FLickr25K的迁移测试中保持85.7% MAP值
  • 长度适应性:16-256位哈希码均表现稳定,最佳性能出现在128位(88.46% MAP)

讨论与结论
该研究首次将自博弈概念引入图像哈希领域,通过时序延迟比较实现了特征空间的智能演化。改进的sigmoid函数有效解决了深度学习哈希中实值向二值转换的瓶颈问题。实验证明该方法在旋转(±30°)、JPEG压缩(质量因子20)等干扰下仍保持83%以上的识别率,较传统方法提升12%-15%。尽管存在训练复杂度较高的局限,但其在数字版权保护、敏感内容过滤等场景展现出应用潜力。论文成果发表于《Expert Systems with Applications》,为感知哈希研究提供了新范式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号