
-
生物通官微
陪你抓住生命科技
跳动的脉搏
OBEPA:基于对象嵌入预测对齐的半监督目标检测新范式
【字体: 大 中 小 】 时间:2025年07月09日 来源:Pattern Recognition 7.5
编辑推荐:
针对半监督目标检测(SSOD)中嵌入对齐技术研究不足的问题,研究人员提出OBEPA框架,通过嵌入预测器和对象感知对比学习,在MS-COCO和Pascal VOC基准测试中实现SOTA性能。该研究首次将知识蒸馏中的嵌入对齐技术引入SSOD领域,为提升模型特征提取能力提供了新思路。
在计算机视觉领域,目标检测(Object Detection)技术的性能提升长期依赖大量标注数据,但数据标注成本高昂成为制约发展的瓶颈。半监督目标检测(Semi-Supervised Object Detection, SSOD)通过结合少量标注数据和大量未标注数据进行训练,为破解这一难题提供了可能。当前主流SSOD方法基于教师-学生(teacher-student)框架,但多数研究聚焦于伪标签(pseudo-label)的优化筛选,忽视了嵌入表示(embedding)层面的知识迁移。
针对这一研究空白,研究人员创新性地提出OBject-Embedding Predictive Alignment (OBEPA)框架。该工作首次将知识蒸馏(Knowledge Distillation)中的嵌入对齐技术引入SSOD领域,通过两个关键创新点突破性能瓶颈:一是设计嵌入预测器(predictor)补偿强数据增强造成的信息损失,二是提出平衡分层嵌入聚类(balanced hierarchical embedding clustering)结合对象感知InfoNCE损失(object-aware InfoNCE loss),在像素级实现对象表征的对比学习。实验表明,OBEPA在MS-COCO和Pascal VOC两大基准测试中均超越现有最优方法。
关键技术方法包括:1)在教师-学生框架中引入轻量级卷积网络作为嵌入预测器;2)采用分层聚类策略处理图像内所有像素级表征;3)设计对象感知对比损失函数,以教师分支嵌入作为正样本,其他聚类中心作为负样本;4)使用包含123K未标注图像的MS-COCO unlabeled2017和Pascal VOC07/VOC12混合数据集验证性能。
【主要研究结果】
该研究开创性地证明了嵌入对齐技术在SSOD领域的应用价值,为解决数据标注依赖问题提供了新范式。特别是对象感知对比学习机制的提出,使模型能够自主挖掘未标注数据中的对象级语义信息,这对医疗影像分析等标注成本极高的领域具有重要启示意义。未来研究可进一步探索嵌入预测器与不同增强策略的适配性,以及该方法在视频目标检测等时序任务中的扩展应用。
生物通微信公众号
知名企业招聘