基于多标签增强Transformer哈希的跨模态检索方法研究

【字体: 时间:2025年08月22日 来源:Expert Systems with Applications 7.5

编辑推荐:

  本文提出了一种创新的多标签增强Transformer哈希(MATH)方法,通过标签模态特征融合(LMFF)模块和跨模态对比对齐损失,有效解决了多标签特征稀疏性问题,显著提升了深度跨模态哈希(DCMH)的检索性能。该方法在三个基准数据集上实现了最先进的(SOTA)表现,为多媒体信息检索领域提供了新思路。

  

亮点

我们提出了一种革命性的多标签增强Transformer哈希(MATH)方法,通过将多标签信息作为独立模态来指导跨模态哈希函数学习。这种方法巧妙地利用Transformer架构捕捉图像、文本和多标签模态间的长程特征依赖关系,为跨模态检索开辟了新途径。

相关研究

本节回顾了深度跨模态哈希(DCMH)、多标签语义学习、注意力机制和对比学习的研究进展。与现有方法相比,我们的创新在于:首次将多标签作为独立模态,并开发了专门的标签模态特征融合技术。

方法创新

我们设计的标签模态特征融合(LMFF)模块堪称点睛之笔——它像一位精明的"特征调酒师",通过注意力机制从图像和文本模态中提取关键语义特征,与原始多标签特征完美融合,彻底解决了多标签特征稀疏性问题。

学习算法

采用交替优化策略更新参数θv、θl、θt和B,就像精心编排的交响乐,每个参数在固定其他变量时都能得到最优调整。我们还提供了严谨的时间复杂度分析,确保方法的高效性。

实验验证

在三个基准数据集上的实验就像一场精彩的"擂台赛"——MATH方法在各项指标上均击败了现有跨模态哈希(CMH)方法,特别是在处理复杂多标签数据时展现出显著优势。

结论

这项研究就像为跨模态检索领域安装了一台"语义增强器":通过创新的多标签特征融合和对比对齐技术,成功缩小了模态间的语义鸿沟,为大规模多媒体检索提供了高效解决方案。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号