
-
生物通官微
陪你抓住生命科技
跳动的脉搏
深度自适应梯度三元组哈希:面向跨模态检索的异构数据嵌入优化框架
【字体: 大 中 小 】 时间:2025年06月12日 来源:Expert Systems with Applications 7.5
编辑推荐:
为解决传统三元组损失中固定梯度和人工设定相似性边界导致的样本适应性差、哈希码质量下降问题,研究人员提出深度自适应梯度三元组哈希(DAGtH)框架,通过动态梯度分配和Householder量化损失,实现跨模态数据的高效嵌入与检索。实验表明,DAGtH在MIRFLICKR-25K等数据集上mAP提升0.61%-13.8%,为大规模多媒体检索提供新思路。
随着互联网和多媒体数据的爆炸式增长,图像、文本等跨模态检索需求日益迫切。传统方法面临两大挑战:一是固定梯度的三元组损失难以适应样本差异,导致难负样本区分度不足;二是哈希学习中相似性与量化过程的相互干扰,造成嵌入空间失真。针对这些问题,潍坊学院(QinLab-WFU)的研究团队提出了深度自适应梯度三元组哈希(DAGtH)框架,相关成果发表于《Expert Systems with Applications》。
研究采用双阶段学习策略:首先通过自适应梯度三元组损失动态调整样本边界,保留原始空间的邻域关系;其次引入Householder正交变换量化,减少嵌入到二进制码的压缩损失。关键技术包括基于样本硬度的梯度分配算法、特征学习与哈希学习的解耦设计,以及MIRFLICKR-25K、NUS-WIDE等基准数据集的验证。
【Methodology】
DAGtH框架包含特征学习和哈希学习模块。前者通过深度网络提取多模态特征;后者创新性提出自适应梯度-triplet损失,根据三元组难度分配梯度权重,并采用Householder量化损失最小化二值化误差。实验显示,该方法在16-64位编码长度下均保持最优性能。
【Experiments】
在MIRFLICKR-25K等数据集上,DAGtH的mAP较现有方法提升最高达13.8%。消融实验证实,自适应梯度机制使难负样本召回率提升21%,而正交量化使二进制码信息损失降低37%。
【Conclusion】
该研究突破了传统跨模态哈希的静态优化局限,通过动态梯度调节和量化分离策略,显著提升检索精度。未来可扩展至视频-文本等更复杂模态,并为医疗影像等多模态数据分析提供新范式。
生物通微信公众号
知名企业招聘