
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于对象感知的光流估计框架O2Flow:提升运动物体区域光流预测性能的创新研究
【字体: 大 中 小 】 时间:2025年07月25日 来源:Pattern Recognition Letters 3.9
编辑推荐:
针对现有光流估计方法在运动物体周边区域性能显著下降的问题,研究人员提出对象感知光流估计框架O2Flow,通过双分支结构(OA-branch和FP-branch)融合对象级信息,在Sintel和KITTI-2015基准测试中达到SOTA,为自动驾驶等场景提供更精准的运动建模。
在计算机视觉领域,光流估计(optical flow estimation)作为描述相邻帧间像素运动的基础任务,长期面临一个关键瓶颈:现有方法在运动物体周边区域的预测误差显著高于静态背景区域。这一现象在自动驾驶、动作识别等实际应用中可能引发严重后果。传统方法如HS-Flow和LK-Flow虽具有理论优势,但深度学习方法普遍聚焦于局部或全局匹配线索,忽视了人类视觉系统中至关重要的对象级(object-level)信息理解机制。
为突破这一局限,中国国家自然科学基金支持的研究团队提出创新性解决方案——对象感知光流估计框架O2Flow。该框架通过双分支协同架构,首次将对象意识系统性地引入光流预测流程:对象感知分支(OA-branch)通过辅助训练任务捕获运动物体特征,流预测分支(FP-branch)则通过特征融合模块整合对象信息。这种设计在无需额外标注的情况下,仅利用光流真值生成对象掩膜(object-aware masks),显著提升了运动边界区域的预测精度。相关成果发表于《Pattern Recognition Letters》,在Sintel和KITTI-2015基准测试中刷新了两视图方法的性能记录。
关键技术方法包括:1)基于光流真值的运动物体掩膜自动生成技术;2)双分支网络架构设计(OA-branch与FP-branch);3)特征融合模块实现对象信息与运动特征的层级交互;4)端到端联合训练策略平衡主任务(光流预测)与辅助任务(运动物体分割)。实验采用FlyingChairs和FlyingThings3D作为训练集,以EPE(端点误差)、EPE-O(运动区域误差)和EPE-P(静态区域误差)作为核心评价指标。
【研究结果】
【结论与意义】
该研究首次揭示对象意识缺失是光流估计瓶颈的本质原因,提出的O2Flow框架通过三项创新实现突破:1)建立对象感知与运动建模的显式关联;2)开发无需监督信号的掩膜生成方法;3)设计轻量化可插拔的OA-branch模块。这不仅为光流估计提供新范式,其对象意识机制更可拓展至视频分割、自动驾驶等多场景。未来研究可进一步探索动态对象的分层建模,以及在事件相机等新型视觉传感器上的应用。
生物通微信公众号
知名企业招聘