用于无ArUco的基于RGB的6自由度（6-DoF）物体姿态估计的生成式数据增强方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Imaging》：Generative Data Augmentation for ArUco-Free RGB-Based 6-DoF Object Pose Estimation

【字体：大中小】 时间：2026年06月09日 来源：Journal of Imaging 3.3

编辑推荐：

　　摘要近年来，数据驱动的方法在工业计算机视觉应用中变得越来越重要，尤其是在6自由度（6-DoF）物体姿态估计方面。然而，基准数据集可能会无意中引入偏见，从而影响学习到的模型的可靠性。在这项工作中，我们研究了广泛使用的Li

摘要

近年来，数据驱动的方法在工业计算机视觉应用中变得越来越重要，尤其是在6自由度（6-DoF）物体姿态估计方面。然而，基准数据集可能会无意中引入偏见，从而影响学习到的模型的可靠性。在这项工作中，我们研究了广泛使用的Linemod数据集中由基准ArUco标记引起的捷径偏见。尽管这些标记在真实的工业环境中通常不存在，但它们会引入神经网络倾向于利用的视觉线索。因此，基于最先进基准的模型选择可能会有偏见，因为报告的性能往往反映了对这些捷径的依赖，而不是对鲁棒特征提取的依赖。通过使用显著性图分析，我们发现模型的大部分注意力都集中在这些标记上，揭示了人为提高姿态估计性能的捷径的存在。为了解决这个问题，我们提出了一种基于生成式AI技术的数据增强流程，该流程移除了这些标记，并用更真实的合成场景替换了背景。实验结果表明，当在原始Linemod数据集上训练的模型在无ArUco的环境中评估时，性能明显下降，这证实了背景引起的偏见的存在。使用所提出的生成式替换数据集进行训练可以提高模型的鲁棒性，并更好地泛化到未见过的场景，尽管它并不能完全消除这个问题。总体而言，这些结果突显了背景相关偏见在姿态估计基准中的影响，并表明所提出的增强策略是朝着开发更可靠的6-DoF姿态估计系统迈出的实际且可扩展的步骤，同时为进一步改进留下了空间。

联系信箱：

粤ICP备09063491号

摘要

热点排行