
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多尺度自适应滤波目标追踪算法MSAF:基于最速下降法的动态外观建模与特征编码优化
【字体: 大 中 小 】 时间:2025年06月26日 来源:Expert Systems with Applications 7.5
编辑推荐:
针对目标追踪中固定尺度外观模型和单一特征编码器导致的表征能力受限问题,研究人员提出多尺度自适应滤波算法(MSAF)和自适应分类特征编码器(ADCFE)。通过最速下降法实现快速在线学习,结合多粒度特征融合,在GOT-10K数据集上AO(62.9%)和SR0.5(75.7%)指标显著提升,为复杂场景下的目标追踪提供新思路。
在计算机视觉领域,目标追踪(Object Tracking)是一项极具挑战性的任务,其核心在于通过视频首帧的初始信息预测目标运动轨迹。然而,目标外观的动态变化、背景干扰以及尺度变化等问题,使得传统追踪算法难以兼顾精度与鲁棒性。现有方法如相关滤波(CF)和卷积核追踪器虽取得进展,但固定尺度的滤波器和堆叠卷积层的特征编码器,限制了模型对多粒度特征的捕捉能力。
针对这些瓶颈,研究人员提出MSAF(Multi-Scale Adaptive Filter)算法。该研究首次系统论证了滤波器尺度对外观模型的影响:不同尺寸的滤波器能捕捉不同粒度的特征模式,而单一固定尺度会导致表征能力不足。例如,传统CF方法(如Bolme et al.提出的MOSSE)仅使用单尺度滤波器,而卷积核追踪器(如DiMP)虽引入CNN特征,却未考虑通道间多尺度特征的融合。
关键技术方法
研究团队采用两项创新技术:(1)基于最速下降法(Steepest Descent)优化的多尺度自适应滤波器,动态融合不同尺度特征;(2)自适应分类特征编码器(ADCFE),通过跨通道聚合多粒度特征增强上下文表征。实验使用ResNet18为基线,在OTB100、VOT2018等6个基准数据集验证性能。
研究结果
结论与意义
该研究通过多尺度动态建模和特征编码优化,解决了目标追踪中外观表征不足的核心问题。MSAF的快速收敛特性(得益于最速下降法)使其适用于实际应用场景,而ADCFE模块为多粒度特征融合提供了通用框架。论文发表于《Expert Systems with Applications》,其技术路径对视频监控、自动驾驶等领域的鲁棒追踪具有重要参考价值。
生物通微信公众号
知名企业招聘