
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多标签增强Transformer哈希的跨模态检索方法研究
【字体: 大 中 小 】 时间:2025年08月22日 来源:Expert Systems with Applications 7.5
编辑推荐:
本文提出了一种创新的多标签增强Transformer哈希(MATH)方法,通过标签模态特征融合(LMFF)模块和跨模态对比对齐损失,有效解决了多标签特征稀疏性问题,显著提升了深度跨模态哈希(DCMH)的检索性能。该方法在三个基准数据集上实现了最先进的(SOTA)表现,为多媒体信息检索领域提供了新思路。
亮点
我们提出了一种革命性的多标签增强Transformer哈希(MATH)方法,通过将多标签信息作为独立模态来指导跨模态哈希函数学习。这种方法巧妙地利用Transformer架构捕捉图像、文本和多标签模态间的长程特征依赖关系,为跨模态检索开辟了新途径。
相关研究
本节回顾了深度跨模态哈希(DCMH)、多标签语义学习、注意力机制和对比学习的研究进展。与现有方法相比,我们的创新在于:首次将多标签作为独立模态,并开发了专门的标签模态特征融合技术。
方法创新
我们设计的标签模态特征融合(LMFF)模块堪称点睛之笔——它像一位精明的"特征调酒师",通过注意力机制从图像和文本模态中提取关键语义特征,与原始多标签特征完美融合,彻底解决了多标签特征稀疏性问题。
学习算法
采用交替优化策略更新参数θv、θl、θt和B,就像精心编排的交响乐,每个参数在固定其他变量时都能得到最优调整。我们还提供了严谨的时间复杂度分析,确保方法的高效性。
实验验证
在三个基准数据集上的实验就像一场精彩的"擂台赛"——MATH方法在各项指标上均击败了现有跨模态哈希(CMH)方法,特别是在处理复杂多标签数据时展现出显著优势。
结论
这项研究就像为跨模态检索领域安装了一台"语义增强器":通过创新的多标签特征融合和对比对齐技术,成功缩小了模态间的语义鸿沟,为大规模多媒体检索提供了高效解决方案。
生物通微信公众号
知名企业招聘