
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于随机关键点丢弃的多视角3D手部重建鲁棒性增强策略RKPOEM研究
【字体: 大 中 小 】 时间:2025年07月19日 来源:Neurocomputing 5.5
编辑推荐:
为解决多视角3D手部重建中因视角质量差异导致的预测不稳定问题,研究人员提出RKPOEM策略,通过随机丢弃特定视角的2D关键点,降低模型对单一视角的依赖,显著提升重建精度(MPJPE/MPVPE降低)与鲁棒性。该方法无需额外推理开销,可无缝集成现有框架,为VR/AR及人机交互提供高效解决方案。
在虚拟现实(VR)和增强现实(AR)技术迅猛发展的今天,高精度3D手部重建成为人机交互的核心技术之一。然而,现有方法面临严峻挑战:多视角重建虽能缓解单视角的深度模糊问题,但在复杂场景下,不同视角的预测质量差异显著,个别低质量视角会拖累整体重建效果。这种视角间的“木桶效应”严重制约了实际应用的可靠性。
针对这一痛点,中国科学技术大学生物医学工程系的Shengjiang Zhang团队在《Neurocomputing》发表了一项创新研究。他们提出RKPOEM(Removed-Keypoint Point-Embedded Multi-view)策略,通过分层级的关键点随机丢弃机制,显著提升了多视角3D手部重建的鲁棒性。该研究在HO3D-MV、DexYCB-MV等基准数据集上的实验表明,RKPOEM使关节位置误差(MPJPE)和顶点位置误差(MPVPE)分别降低15.3%和12.7%,尤其在噪声干扰场景下优势更为突出。
关键技术方法
研究采用三阶段技术路线:首先通过卷积神经网络(CNN)从多视角图像提取2D关键点;随后基于代数三角化(DLT)生成初始3D骨架;最后引入创新的分层丢弃机制——包括人工视角排除、视角级丢弃和关键点级丢弃,其中关键点级随机丢弃被证明最有效。所有实验在PyTorch框架下完成,使用NVIDIA 4090 GPU加速训练。
研究结果
结论与意义
这项研究开创性地将细粒度丢弃策略引入多视角融合领域。其核心价值在于:通过强制模型学习视角无关的空间表征,有效打破了传统方法对特定视角的依赖。相比需要复杂注意力权重计算的现有方案,RKPOEM以“减法”实现“增效”,为医疗可视化、远程操作等需要高鲁棒性的场景提供了即插即用的解决方案。研究团队特别指出,该方法可扩展至其他多视角重建任务,如人体姿态估计和物体三维建模,具有广阔的工业应用前景。
生物通微信公众号
知名企业招聘