基于对象感知的光流估计框架O2Flow:提升运动物体区域光流预测性能的创新研究

【字体: 时间:2025年07月25日 来源:Pattern Recognition Letters 3.9

编辑推荐:

  针对现有光流估计方法在运动物体周边区域性能显著下降的问题,研究人员提出对象感知光流估计框架O2Flow,通过双分支结构(OA-branch和FP-branch)融合对象级信息,在Sintel和KITTI-2015基准测试中达到SOTA,为自动驾驶等场景提供更精准的运动建模。

  

在计算机视觉领域,光流估计(optical flow estimation)作为描述相邻帧间像素运动的基础任务,长期面临一个关键瓶颈:现有方法在运动物体周边区域的预测误差显著高于静态背景区域。这一现象在自动驾驶、动作识别等实际应用中可能引发严重后果。传统方法如HS-Flow和LK-Flow虽具有理论优势,但深度学习方法普遍聚焦于局部或全局匹配线索,忽视了人类视觉系统中至关重要的对象级(object-level)信息理解机制。

为突破这一局限,中国国家自然科学基金支持的研究团队提出创新性解决方案——对象感知光流估计框架O2Flow。该框架通过双分支协同架构,首次将对象意识系统性地引入光流预测流程:对象感知分支(OA-branch)通过辅助训练任务捕获运动物体特征,流预测分支(FP-branch)则通过特征融合模块整合对象信息。这种设计在无需额外标注的情况下,仅利用光流真值生成对象掩膜(object-aware masks),显著提升了运动边界区域的预测精度。相关成果发表于《Pattern Recognition Letters》,在Sintel和KITTI-2015基准测试中刷新了两视图方法的性能记录。

关键技术方法包括:1)基于光流真值的运动物体掩膜自动生成技术;2)双分支网络架构设计(OA-branch与FP-branch);3)特征融合模块实现对象信息与运动特征的层级交互;4)端到端联合训练策略平衡主任务(光流预测)与辅助任务(运动物体分割)。实验采用FlyingChairs和FlyingThings3D作为训练集,以EPE(端点误差)、EPE-O(运动区域误差)和EPE-P(静态区域误差)作为核心评价指标。

【研究结果】

  1. 对象感知有效性验证:通过对比实验证明,现有方法EPE-O较整体EPE平均高出47%,而O2Flow将运动区域误差降低32%,验证对象意识引入的必要性。
  2. 架构优势分析:消融实验显示,单独使用FP-branch时性能与基线相当,但结合OA-branch后KITTI-2015的F1-all指标提升21%,证实双分支协同的有效性。
  3. 基准测试表现:在Sintel最终通道测试中,O2Flow以4.23 EPE超越FlowFormer++(4.31),在KITTI-2015测试集上F1-all达5.17%,创两视图方法新纪录。

【结论与意义】
该研究首次揭示对象意识缺失是光流估计瓶颈的本质原因,提出的O2Flow框架通过三项创新实现突破:1)建立对象感知与运动建模的显式关联;2)开发无需监督信号的掩膜生成方法;3)设计轻量化可插拔的OA-branch模块。这不仅为光流估计提供新范式,其对象意识机制更可拓展至视频分割、自动驾驶等多场景。未来研究可进一步探索动态对象的分层建模,以及在事件相机等新型视觉传感器上的应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号