动态示例网络DEN:基于多轮迭代与负例挖掘的类别无关目标计数方法

【字体: 时间:2025年06月26日 来源:Pattern Recognition 7.5

编辑推荐:

  针对类别无关计数(CAC)任务中示例外观稀缺和判别能力不足的问题,中国科学院团队提出动态示例网络(DEN),通过LEDM模块多轮扩展示例集并引入跨图像负例挖掘策略,在FSC-147等5个数据集上超越FamNet等SOTA方法,显著提升模型泛化能力与判别性能。

  

在计算机视觉领域,类别无关目标计数(Class-Agnostic Counting, CAC)是一项极具挑战性的任务,其核心目标是仅通过少量标注示例,实现对图像中任意类别物体的计数与定位。传统方法如FamNet和Counting-DETR等受限于示例外观多样性不足,难以区分相似物体(如将苹果与帽子误判为同类),且缺乏有效的负样本学习机制。这些瓶颈导致模型在面对复杂场景时泛化能力显著下降,亟需创新性解决方案。

针对这一难题,中国科学院的研究团队在《Pattern Recognition》发表了突破性研究成果。他们提出的动态示例网络(Dynamic Example Network, DEN)通过Location and Example Decoder Module (LEDM)实现多轮示例扩展与预测优化,结合创新的跨数据集负例挖掘策略,在FSC-147、CARPK等5个基准数据集上实现性能飞跃。该工作不仅将平均计数误差降低23.7%,更开创了迭代式示例增强与判别式学习相结合的新范式。

关键技术方法包括:1) 基于锚点的位置与边界框预测模块LEDM;2) 通过外观多样性评估的示例动态扩展机制;3) 全数据集级别的难负例(hard negative)挖掘策略;4) 多轮迭代优化框架。实验采用FSCD-LVIS等包含200+类别的跨域数据集验证泛化性。

【Related work】
现有CAC方法主要分为密度图预测和相似度匹配两类。GMNNet首次引入示例匹配思想,但未解决示例稀缺问题;后续FamNet采用特征对齐模块,Counting-DETR引入Transformer架构,但仍受限于单轮预测模式。DEN的创新在于将示例扩展过程建模为渐进式优化问题。

【Proposed method】
DEN的核心架构包含三级优化:1) 初始阶段通过LEDM生成候选目标位置Bk与置信度sk;2) 基于视觉特征聚类从预测结果中筛选最具多样性的新增示例;3) 通过跨图像对比学习挖掘区分性负例,构建三元组损失Ltriplet。该设计使模型在推理时能动态调整示例集,如实验显示经过3轮迭代可使FSC-147的MAE降低18.6%。

【Experiments】
在FSC-147数据集上,DEN以26.4的MAE超越FamNet(34.2)和CounTR(28.1);在密集场景的CARPK数据集上,车辆计数误差较最优基线降低31%。消融实验证实:负例挖掘策略使误检率下降42%,而多轮迭代使小目标召回率提升29%。

【Limitations and future work】
当前方法存在两点局限:1) 负例可能误伤同类物体;2) 迭代过程增加30%推理耗时。作者建议未来可探索:1) 语义引导的负例筛选;2) 轻量化迭代机制设计。

这项研究的意义在于:1) 首次将动态示例扩展引入CAC任务,突破静态示例的固有局限;2) 构建的跨图像判别学习框架为开放世界识别提供新思路;3) 开源的代码库将推动智慧城市、生态监测等领域的应用创新。正如通讯作者Qingming Huang所述:"DEN的核心价值在于模拟人类渐进式认知过程,这对发展通用视觉系统具有启示意义。"

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号