OBEPA:基于对象嵌入预测对齐的半监督目标检测新范式

【字体: 时间:2025年07月09日 来源:Pattern Recognition 7.5

编辑推荐:

  针对半监督目标检测(SSOD)中嵌入对齐技术研究不足的问题,研究人员提出OBEPA框架,通过嵌入预测器和对象感知对比学习,在MS-COCO和Pascal VOC基准测试中实现SOTA性能。该研究首次将知识蒸馏中的嵌入对齐技术引入SSOD领域,为提升模型特征提取能力提供了新思路。

  

在计算机视觉领域,目标检测(Object Detection)技术的性能提升长期依赖大量标注数据,但数据标注成本高昂成为制约发展的瓶颈。半监督目标检测(Semi-Supervised Object Detection, SSOD)通过结合少量标注数据和大量未标注数据进行训练,为破解这一难题提供了可能。当前主流SSOD方法基于教师-学生(teacher-student)框架,但多数研究聚焦于伪标签(pseudo-label)的优化筛选,忽视了嵌入表示(embedding)层面的知识迁移。

针对这一研究空白,研究人员创新性地提出OBject-Embedding Predictive Alignment (OBEPA)框架。该工作首次将知识蒸馏(Knowledge Distillation)中的嵌入对齐技术引入SSOD领域,通过两个关键创新点突破性能瓶颈:一是设计嵌入预测器(predictor)补偿强数据增强造成的信息损失,二是提出平衡分层嵌入聚类(balanced hierarchical embedding clustering)结合对象感知InfoNCE损失(object-aware InfoNCE loss),在像素级实现对象表征的对比学习。实验表明,OBEPA在MS-COCO和Pascal VOC两大基准测试中均超越现有最优方法。

关键技术方法包括:1)在教师-学生框架中引入轻量级卷积网络作为嵌入预测器;2)采用分层聚类策略处理图像内所有像素级表征;3)设计对象感知对比损失函数,以教师分支嵌入作为正样本,其他聚类中心作为负样本;4)使用包含123K未标注图像的MS-COCO unlabeled2017和Pascal VOC07/VOC12混合数据集验证性能。

【主要研究结果】

  1. 嵌入预测器的有效性:通过补偿强增强(如OcCaMix)造成的信息差异,使学生模型与教师模型的嵌入空间一致性提升32%。
  2. 对象级表征优化:平衡分层聚类策略使同类对象嵌入相似度提高1.8倍,跨类对象区分度扩大40%。
  3. 基准测试表现:在MS-COCO的10%标注数据设定下,mAP0.5:0.95达到42.1%,超越基线方法3.2个百分点。

该研究开创性地证明了嵌入对齐技术在SSOD领域的应用价值,为解决数据标注依赖问题提供了新范式。特别是对象感知对比学习机制的提出,使模型能够自主挖掘未标注数据中的对象级语义信息,这对医疗影像分析等标注成本极高的领域具有重要启示意义。未来研究可进一步探索嵌入预测器与不同增强策略的适配性,以及该方法在视频目标检测等时序任务中的扩展应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号