多尺度伪标签过滤与关键像素对抗对齐的域自适应目标检测方法研究

【字体: 时间:2025年06月09日 来源:Engineering Applications of Artificial Intelligence 7.5

编辑推荐:

  针对域自适应目标检测(DAOD)中伪标签可靠性低和对抗学习像素对齐效率不足的问题,研究人员提出基于单阶段检测器FCOS的多尺度对抗教师框架(MATF)。通过多尺度负样本过滤模块(MNF)剔除不可靠负样本,结合多尺度关键像素判别器(MKPD)实现关键像素对抗对齐,在Cityscapes等数据集上验证了方法的优越性,为自动驾驶等实时检测场景提供高效解决方案。

  

在计算机视觉领域,目标检测(Object Detection)技术如同"火眼金睛",能够精准定位图像中物体的位置和类别。然而,当训练数据(源域)与实际场景(目标域)存在光照、天气等差异时,检测性能会大幅下降——这种现象被称为"域偏移"(Domain Shift)。传统解决方案需要耗费大量人力标注目标域数据,犹如"愚公移山"般低效。为此,域自适应目标检测(DAOD)技术应运而生,试图让模型像"变色龙"一样适应新环境。

当前DAOD方法主要依赖自训练(Self-training)和对抗学习(Adversarial Learning)两大策略。自训练方法通过教师-学生框架生成伪标签(Pseudo-labels),但如同"盲人摸象",缺乏目标域语义会导致伪标签出现漏检(Missing Detection)和误检(False Positive)。对抗学习方法虽能对齐域特征,却像"大海捞针",难以聚焦含关键语义的像素。更棘手的是,现有研究多基于计算复杂的二阶段检测器,难以满足自动驾驶等实时场景需求。

合肥工业大学等机构的研究人员发表在《Engineering Applications of Artificial Intelligence》的这项研究,创新性地提出多尺度对抗教师框架(MATF)。该方法在单阶段检测器FCOS基础上,引入双管齐下的解决方案:多尺度负样本过滤(MNF)模块像"精密筛网",通过多尺度特征分析过滤不可靠负样本;多尺度关键像素判别器(MKPD)则如同"聚光灯",通过可学习的视图(View)预测关键像素分布。实验表明,该方法在Cityscapes至FoggyCityscapes等跨域任务中显著提升检测精度。

关键技术包括:1)基于FCOS的单阶段检测框架;2)教师模型中的MNF模块进行多尺度负样本过滤;3)学生模型中MKPD实现关键像素对抗对齐;4)使用Cityscapes等4个基准数据集验证跨天气、跨相机等适应任务。

【多尺度负样本过滤】
研究发现传统高置信度阈值会加剧漏检问题。MNF模块通过分析检测头在FPN各尺度上的分类预测,筛选最可能为负样本的像素,使学生模型专注学习可靠负样本。这如同为模型配备"纠错本",有效降低漏检带来的负面影响。

【多尺度关键像素判别】
创新性地提出关键像素重要性理论。MKPD包含掩膜生成和加权两个模块:前者通过可学习视图预测关键像素分布,后者为不同掩膜分配权重。该设计让对抗学习像"精确制导"般聚焦富含语义的像素,在FPN各尺度上实现差异化对齐。

【域偏差消除】
受SSAL启发,将MKPD引入学生模型进行域对齐。通过指数移动平均(EMA)将去偏的语义信息传递至教师模型,形成"教学相长"的良性循环,显著提升伪标签质量。

研究结论表明,MATF框架在保持单阶段检测器高效优势的同时:1)MNF使Weather Adaptation任务mAP提升2.3%;2)MKPD在Cross-camera Adaptation任务中降低对齐误差37%;3)整体框架在合成到真实(Synthetic-to-real)任务中超越主流方法。这项研究不仅为DAOD提供了新思路,其"轻量高效"的特性更契合自动驾驶等实时应用需求,犹如为智能驾驶系统装上"自适应镜片",使其在各种复杂环境下都能保持"明察秋毫"的检测能力。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号