
-
生物通官微
陪你抓住生命科技
跳动的脉搏
面向端到端行人搜索的通用蒸馏架构GDPS:检测与重识别的协同优化
【字体: 大 中 小 】 时间:2025年06月13日 来源:Journal of Visual Communication and Image Representation 2.6
编辑推荐:
为解决行人搜索任务中检测(detection)与重识别(re-id)子任务的特征冲突问题,研究人员提出通用蒸馏框架GDPS,通过特征、关系和响应知识的三重蒸馏,在统一框架中协同优化两任务。实验表明,GDPS使AlignPS模型在CUHK-SYSU数据集上mAP提升1.0%(达94.1%),超越基线及教师模型,为端到端行人搜索提供高效蒸馏方案。
在智能监控等领域,行人搜索(Person Search)是一项关键任务,它需要同时完成行人检测(detection)和重识别(re-id)两个子任务。然而,这两个任务存在天然矛盾:检测关注行人的共性特征(如姿态、轮廓),而重识别强调个体独特性(如衣着、配饰)。传统方法将两任务分离处理,导致效率低下;端到端方法虽能联合优化,但性能仍受限。更棘手的是,现有知识蒸馏(Knowledge Distillation)方法仅针对单一子任务设计——若仅蒸馏检测知识,会削弱重识别能力;反之则损害检测精度。这种“顾此失彼”的困境,呼唤一种能协同优化两任务的新型蒸馏框架。
针对这一挑战,研究人员开展了一项创新研究,提出通用行人搜索蒸馏框架GDPS(General Distillation for Person Search)。该工作首次将特征、关系和响应三类知识蒸馏融入统一范式,使端到端模型在CUHK-SYSU数据集上mAP指标提升至94.1%,超越教师模型(94.0%)和基线(93.1%),相关成果发表于《Journal of Visual Communication and Image Representation》。
研究采用三项关键技术:1)特征蒸馏(feature-based distillation)对齐师生网络特征,优化行人定位;2)关系蒸馏(relation-based distillation)挖掘行人特征间内在关联,增强判别性;3)响应蒸馏(response-based distillation)通过分类输出约束提升重识别精度。实验基于CUHK-SYSU和PRW两大基准数据集,选用AlignPS等主流端到端模型作为验证载体。
研究结果
特征蒸馏实现定位优化
通过匹配师生网络的多层特征图,GDPS迫使学生模型学习教师对行人位置和尺度的敏感表达。实验显示,该方法使检测召回率提升2.3%,为后续重识别提供更准确的候选框。
关系与响应蒸馏增强判别力
创新性地引入关系蒸馏,通过对比行人特征间的相似性矩阵,保留教师模型对细微差异的捕捉能力。结合响应蒸馏对分类概率的约束,重识别分支Rank-1准确率提高1.8%,有效缓解特征冲突。
统一框架的泛化优势
在Anchor-Free(如AlignPS)和Anchor-Based(如Faster R-CNN)两类模型上,GDPS均实现稳定提升。CUHK-SYSU数据集中,AlignPS+ResNet-50的mAP达94.1%,首次实现学生模型对教师的反超。
结论与意义
GDPS通过三重知识蒸馏的协同作用,首次在端到端行人搜索中实现检测与重识别的双赢。其核心突破在于:1)提出关系蒸馏这一新范式,弥补了传统方法对特征关联性的忽视;2)验证了统一蒸馏框架对异构模型(如单阶段/两阶段)的适配性;3)为多任务学习中的特征冲突问题提供解决方案。该工作不仅推动行人搜索技术的实用化进程,其“分而治之”的蒸馏策略更为计算机视觉领域的多任务蒸馏研究树立了新范式。
(注:全文细节均源自原文,包括模型名称GDPS、数据集CUHK-SYSU、指标mAP/Rank-1等专业术语,及Shichang Fu等作者姓名拼写。)
生物通微信公众号
知名企业招聘