基于双流隐显变换的类别级6D位姿估计方法EIF-6D研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《IEEE Access》：EIF-6D: Enhancing Category-Level 6D Pose Estimation through Dual-Stream Implicit-Explicit Transformation

【字体：大中小】 时间：2026年02月10日 来源：IEEE Access 3.6

编辑推荐：

　　本文针对类别级6D位姿估计中存在的类内形状差异和遮挡鲁棒性问题，提出了一种融合显式与隐式形变机制的双流变换网络EIF-6D。通过先验变换模块(PTM)和先验特征变换模块(PFTM)实现从粗到精的优化，在NOCS-REAL275数据集上达到50.6%(5°2cm)和57.4%(5°5cm)的平均精度，创下基于形状先验方法的新标杆。

在机器人抓取和增强现实等应用场景中，让机器准确感知物体的三维位置、朝向和尺寸至关重要，这就是类别级6D位姿估计的核心任务。与传统实例级方法不同，类别级方法需要应对从未见过的同类物体，比如不同型号的杯子或笔记本电脑。当前主流方法面临两大困境：基于形状先验的方法通过显式形变场建立对应关系，但受限于类内形状差异；而无形状先验的方法直接回归观测特征，又在遮挡情况下表现不稳定。

为解决这一难题，YuanChenWe等人提出了EIF-6D创新框架，该工作发表于《IEEE Access》。研究人员设计了一种双流变换网络，巧妙融合了显式与隐式形变机制。通过先验变换模块(PTM)实现粗对齐，再经由先验特征变换模块(PFTM)进行精细优化，形成从粗到精的位姿估计流程。在NOCS-REAL275基准数据集上的实验表明，该方法在严格评估标准下显著超越现有技术。

关键技术方法包括：双流网络架构设计、显式-隐式形变融合机制、先验变换模块(PTM)的粗对齐策略、先验特征变换模块(PFTM)的精细优化方法。实验使用NOCS-REAL275数据集进行验证。

研究结果

网络架构有效性验证

通过消融实验证实，双流设计相比单流架构能提升约8.3%的精度，显式与隐式机制的互补性在复杂遮挡场景下表现尤为突出。

形变模块性能分析

PTM模块将初始位姿误差降低至15°以内，为后续PFTM模块的精细调整奠定基础。特征对齐精度比基线方法提高约12.7%。

跨类别泛化能力

在杯子、摄像头、笔记本电脑等六大类别上，EIF-6D均保持稳定性能，特别是在形状差异较大的餐具类别上，其优势更加明显。

遮挡鲁棒性测试

在模拟30%-70%遮挡程度的极端条件下，该方法仍能保持45.2%的平均精度，远超对比方法的28.7%。

本研究开创性地将显式与隐式形变机制相结合，为类别级6D位姿估计提供了新思路。EIF-6D不仅解决了形状先验方法对类内差异敏感的问题，还克服了无先验方法在遮挡下的不稳定性。该技术框架为机器人精准操作和AR/VR场景理解奠定了坚实基础，其代码开源将进一步推动领域发展。未来工作可探索多模态信息融合等方向，持续提升复杂环境下的位姿估计可靠性。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号