实例感知的全局重检测方法:实现精准高效的长时视觉跟踪

【字体: 时间:2025年08月28日 来源:Neurocomputing 6.5

编辑推荐:

  本文提出了一种基于单阶段无锚框框架的实例感知全局重检测方法(IGR),通过实例引导特征调制模块和动态样本选择策略,显著提升了长时视觉跟踪(LTOT)在目标消失重现场景下的重检测性能。实验表明,该方法与四种局部跟踪器(如EVPTrack、TransT)结合后,在LaSOT等六大数据集上最高实现58 FPS的实时性能,成功率提升达10.5%(UAV20L),为计算机视觉领域的长期目标跟踪提供了高效解决方案。

  

Highlight

我们提出了一种基于单阶段框架的实例感知全局重检测方法(Instance-aware Global Re-detection, IGR),相比基线方法在速度和性能上均取得显著提升。该方法融合了实例引导特征调制模块(Instance-guided Feature Modulation)和实例级动态采样策略(Instance-level Dynamic Sampling),增强了模型对特定目标的感知能力。与局部跟踪器结合后,形成了可实现高效精准长时视觉跟踪(LTOT)的本地-全局框架。

Method

本节详细介绍了提出的全局重检测方法,重点聚焦两个核心组件:

  1. 1.

    实例引导特征调制模块:通过改进的特征混合与增强技术,提升算法对跟踪目标的实例感知能力;

  2. 2.

    实例级动态样本选择策略:自适应平衡正负样本,增强模型抗相似目标干扰的鲁棒性。

Implementation details

训练细节:采用ImageNet预训练的ResNet-50作为主干网络,在COCO2017、LaSOT和GOT-10k数据集上进行训练。损失函数权重设为λ1=1,λ2=2,λ3=1,使用SGD优化器,初始学习率0.005。

Conclusion

基于单阶段框架的实例感知重检测方法,通过与本地跟踪器结合,构建了能实现高效精准长时视觉跟踪的完整框架。大量实验验证了该方法在提升跟踪性能方面的优越性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号