
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度语义中心引导哈希的多标签跨模态检索方法研究
【字体: 大 中 小 】 时间:2025年06月26日 来源:Expert Systems with Applications 7.5
编辑推荐:
针对多标签跨模态检索中哈希中心语义关联不足的问题,研究人员提出深度语义中心引导哈希(DSCGH)方法,通过分类器权重构建语义保持的哈希中心,结合多标签中心损失和离散比特去相关约束,显著提升检索性能。实验表明,DSCGH在MRIFLICKR-25K等数据集上优于基线方法,为跨模态检索提供了新思路。
在互联网数据爆炸式增长的今天,社交媒体平台每天产生海量的图像、文本和视频等多模态数据。如何高效准确地从这些异构数据中检索相关信息,成为亟待解决的挑战。传统的单模态检索系统在面对跨模态查询时(例如用文本搜索图像)往往力不从心,而现有的跨模态哈希方法又存在哈希中心语义关联不足、多标签相关性建模不充分等问题。针对这些瓶颈,曲阜师范大学的研究团队在《Expert Systems with Applications》发表了题为"Deep Semantic Center-Guided Hashing for Multi-Label Cross-Modal Retrieval"的研究论文,提出了一种创新的深度语义中心引导哈希(DSCGH)框架。
该研究主要采用三种关键技术:1)基于分类器权重的哈希中心生成策略,将类别语义先验融入中心构建;2)多标签中心损失函数,建模跨模态复杂标签相关性;3)离散比特去相关约束,减少哈希码冗余。实验数据来自MRIFLICKR-25K、NUS-WIDE和IAPR TC-12三个基准数据集。
研究结果部分:
结论表明,DSCGH在三个数据集上的跨模态检索mAP指标均显著优于对比方法,尤其对"图像→文本"检索任务提升达6.8%。该研究的创新点在于首次将类别语义先验系统性地引入哈希中心学习,为多标签跨模态检索提供了新范式。尽管当前模型尚不支持音频等新模态处理,但其核心框架为后续扩展奠定了基础。作者建议未来可探索自监督预训练与哈希中心的联合优化,进一步提升模型泛化能力。
生物通微信公众号
知名企业招聘