基于选择性循环移位窗口加速Transformer的目标跟踪网络研究

【字体: 时间:2025年08月09日 来源:Digital Signal Processing 3

编辑推荐:

  本文创新性地提出SCWATT(选择性循环移位窗口加速Transformer)网络,通过多尺度循环移位窗口注意力机制(Multi-scale Cyclic-shifted Window Attention)替代传统像素级注意力,结合快速傅里叶变换(FFT)实现频域计算优化,显著提升目标跟踪在尺度变化、复杂背景和遮挡场景下的性能。研究引入动态模板更新策略和选择性消除(SE)模块,在LaSOT等五大基准数据集上超越现有SOTA方法。

  

Highlight

视频目标跟踪(VOT)作为计算机视觉核心领域,在无人机监控(UAV tracking)和自动驾驶等场景展现巨大潜力。传统基于卷积神经网络(CNN)的Siamese跟踪器因局部感知缺陷难以建立长程依赖,而Transformer网络凭借自注意力机制(Self-attention)实现突破性进展。

Proposed network

本研究构建的SCWATT网络包含三大创新模块:

  1. 多尺度循环移位窗口注意力机制:通过窗口级特征匹配保留目标语义完整性,利用循环移位策略增强尺度变化感知能力

  2. 频域加速计算:应用卷积定理将空间域循环样本的关联运算转化为频域点乘(Point-wise Multiplication),计算效率提升40%

  3. 选择性消除(SE)模块:动态筛选模板与搜索帧的关键区域,抑制背景干扰

Experiment

在LaSOT[28]和GOT-10k[29]等数据集测试显示,SCWATT在精确度(Precision)和成功率(Success Rate)指标上均超越STARK[27]等先进方法。特别在遮挡场景下,其动态模板更新机制使跟踪鲁棒性提升23.7%。

Conclusion

本研究通过生物启发式设计,将Transformer的时空信息建模能力与高效频域计算相结合。未来将探索该框架在医学图像跟踪(如细胞运动分析)中的应用潜力。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号