用于无ArUco的基于RGB的6自由度(6-DoF)物体姿态估计的生成式数据增强方法
《Journal of Imaging》:Generative Data Augmentation for ArUco-Free RGB-Based 6-DoF Object Pose Estimation
【字体:
大
中
小
】
时间:2026年06月09日
来源:Journal of Imaging 3.3
编辑推荐:
摘要
近年来,数据驱动的方法在工业计算机视觉应用中变得越来越重要,尤其是在6自由度(6-DoF)物体姿态估计方面。然而,基准数据集可能会无意中引入偏见,从而影响学习到的模型的可靠性。在这项工作中,我们研究了广泛使用的Li
摘要
近年来,数据驱动的方法在工业计算机视觉应用中变得越来越重要,尤其是在6自由度(6-DoF)物体姿态估计方面。然而,基准数据集可能会无意中引入偏见,从而影响学习到的模型的可靠性。在这项工作中,我们研究了广泛使用的Linemod数据集中由基准ArUco标记引起的捷径偏见。尽管这些标记在真实的工业环境中通常不存在,但它们会引入神经网络倾向于利用的视觉线索。因此,基于最先进基准的模型选择可能会有偏见,因为报告的性能往往反映了对这些捷径的依赖,而不是对鲁棒特征提取的依赖。通过使用显著性图分析,我们发现模型的大部分注意力都集中在这些标记上,揭示了人为提高姿态估计性能的捷径的存在。为了解决这个问题,我们提出了一种基于生成式AI技术的数据增强流程,该流程移除了这些标记,并用更真实的合成场景替换了背景。实验结果表明,当在原始Linemod数据集上训练的模型在无ArUco的环境中评估时,性能明显下降,这证实了背景引起的偏见的存在。使用所提出的生成式替换数据集进行训练可以提高模型的鲁棒性,并更好地泛化到未见过的场景,尽管它并不能完全消除这个问题。总体而言,这些结果突显了背景相关偏见在姿态估计基准中的影响,并表明所提出的增强策略是朝着开发更可靠的6-DoF姿态估计系统迈出的实际且可扩展的步骤,同时为进一步改进留下了空间。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号