用于无ArUco的基于RGB的6自由度(6-DoF)物体姿态估计的生成式数据增强方法

《Journal of Imaging》:Generative Data Augmentation for ArUco-Free RGB-Based 6-DoF Object Pose Estimation

【字体: 时间:2026年06月09日 来源:Journal of Imaging 3.3

编辑推荐:

   摘要 近年来,数据驱动的方法在工业计算机视觉应用中变得越来越重要,尤其是在6自由度(6-DoF)物体姿态估计方面。然而,基准数据集可能会无意中引入偏见,从而影响学习到的模型的可靠性。在这项工作中,我们研究了广泛使用的Li

  

摘要

近年来,数据驱动的方法在工业计算机视觉应用中变得越来越重要,尤其是在6自由度(6-DoF)物体姿态估计方面。然而,基准数据集可能会无意中引入偏见,从而影响学习到的模型的可靠性。在这项工作中,我们研究了广泛使用的Linemod数据集中由基准ArUco标记引起的捷径偏见。尽管这些标记在真实的工业环境中通常不存在,但它们会引入神经网络倾向于利用的视觉线索。因此,基于最先进基准的模型选择可能会有偏见,因为报告的性能往往反映了对这些捷径的依赖,而不是对鲁棒特征提取的依赖。通过使用显著性图分析,我们发现模型的大部分注意力都集中在这些标记上,揭示了人为提高姿态估计性能的捷径的存在。为了解决这个问题,我们提出了一种基于生成式AI技术的数据增强流程,该流程移除了这些标记,并用更真实的合成场景替换了背景。实验结果表明,当在原始Linemod数据集上训练的模型在无ArUco的环境中评估时,性能明显下降,这证实了背景引起的偏见的存在。使用所提出的生成式替换数据集进行训练可以提高模型的鲁棒性,并更好地泛化到未见过的场景,尽管它并不能完全消除这个问题。总体而言,这些结果突显了背景相关偏见在姿态估计基准中的影响,并表明所提出的增强策略是朝着开发更可靠的6-DoF姿态估计系统迈出的实际且可扩展的步骤,同时为进一步改进留下了空间。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号