
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于选择性循环移位窗口加速Transformer的目标跟踪网络研究
【字体: 大 中 小 】 时间:2025年08月09日 来源:Digital Signal Processing 3
编辑推荐:
本文创新性地提出SCWATT(选择性循环移位窗口加速Transformer)网络,通过多尺度循环移位窗口注意力机制(Multi-scale Cyclic-shifted Window Attention)替代传统像素级注意力,结合快速傅里叶变换(FFT)实现频域计算优化,显著提升目标跟踪在尺度变化、复杂背景和遮挡场景下的性能。研究引入动态模板更新策略和选择性消除(SE)模块,在LaSOT等五大基准数据集上超越现有SOTA方法。
Highlight
视频目标跟踪(VOT)作为计算机视觉核心领域,在无人机监控(UAV tracking)和自动驾驶等场景展现巨大潜力。传统基于卷积神经网络(CNN)的Siamese跟踪器因局部感知缺陷难以建立长程依赖,而Transformer网络凭借自注意力机制(Self-attention)实现突破性进展。
Proposed network
本研究构建的SCWATT网络包含三大创新模块:
多尺度循环移位窗口注意力机制:通过窗口级特征匹配保留目标语义完整性,利用循环移位策略增强尺度变化感知能力
频域加速计算:应用卷积定理将空间域循环样本的关联运算转化为频域点乘(Point-wise Multiplication),计算效率提升40%
选择性消除(SE)模块:动态筛选模板与搜索帧的关键区域,抑制背景干扰
Experiment
在LaSOT[28]和GOT-10k[29]等数据集测试显示,SCWATT在精确度(Precision)和成功率(Success Rate)指标上均超越STARK[27]等先进方法。特别在遮挡场景下,其动态模板更新机制使跟踪鲁棒性提升23.7%。
Conclusion
本研究通过生物启发式设计,将Transformer的时空信息建模能力与高效频域计算相结合。未来将探索该框架在医学图像跟踪(如细胞运动分析)中的应用潜力。
生物通微信公众号
知名企业招聘