《Journal of Imaging》:A Robust 3D Registration Method via Simultaneous Inlier Identification and Model Estimation
编辑推荐:
鲁棒三维配准(Robust 3D Registration)是森林计算机视觉和机器人学中的一个基本问题,其目标是在存在噪声和外点污染的情况下估计两组测量值之间的几何变换。现有的鲁棒配准方法主要基于最大一致性(Maximum Consensus, MC)估计器(
鲁棒三维配准(Robust 3D Registration)是森林计算机视觉和机器人学中的一个基本问题,其目标是在存在噪声和外点污染的情况下估计两组测量值之间的几何变换。现有的鲁棒配准方法主要基于最大一致性(Maximum Consensus, MC)估计器(先识别内点然后估计变换)或M估计器(M-estimators,直接优化鲁棒目标函数)。然而,基于MC的方法通常在内点选择过程中忽略残差大小,而许多M估计器没有明确地将内点/外点识别与模型估计耦合起来。因此,对于具有挑战性的三维配准问题,仍需要一个能够联合执行内点识别和精确变换估计的统一且高效的框架。在本工作中,研究人员引入了一种统一的基于截断损失(truncated loss)的同步内点识别与模型估计(Simultaneous Inlier Identification and Model Estimation, SIME)公式,并在三维配准背景下对其进行研究。研究人员表明,与基于MC的鲁棒拟合相比,SIME可以获得更低的拟合残差,因为它将残差大小纳入内点选择过程。为了解决由此产生的非凸问题,研究人员开发了一种交替最小化(Alternating Minimization, AM)算法,并进一步提出了一种嵌入半定松弛(Semidefinite Relaxation, SDR)的AM方法(AM-R),以缓解由二元内点变量带来的困难。研究人员使用基于四元数(quaternion)的公式将所提出的框架实例化用于三维旋转搜索(3D Rotation Search)和刚性点集配准(Rigid Point-set Registration)。在模拟和真实配准任务上的实验结果表明,所提出的方法与强基线求解器相比具有优势,尤其是在高噪声和极端外点情况下。在合成实验中,所提出的方法在外点率高达95%的情况下进行评估,并始终达到竞争性或更好的精度,在高噪声情况下具有明显优势。在3DMatch上,SIME (AM) 达到了91.0%的平均配准成功率。这些结果显示SIME在实际机器人学、计算机视觉和几何感知应用中用于可靠三维配准的潜力。
三维配准(3D registration)是计算机视觉和机器人学中的核心问题,其目标是在存在测量噪声和外点(outlier)对应关系的情况下,估计两组三维数据之间的几何变换(如旋转或刚体运动)。现有鲁棒配准方法主要分为两大类:一是基于最大一致性(maximum consensus, MC)的估计器,先识别内点(inlier)再估计变换;二是M估计器(M-estimator),直接优化鲁棒目标函数。然而,MC方法在内点选择时忽略残差大小,许多M估计器未显式耦合内点/外点识别与模型估计。因此,研究人员提出一种统一的截断损失(truncated loss)公式,用于同步内点识别与模型估计(simultaneous inlier identification and model estimation, SIME),并在三维配准背景下进行研究。理论分析表明,SIME相比MC可实现更低的拟合残差,因其在选内点时纳入了残差幅度。研究人员开发了两种交替最小化(alternating minimization, AM)算法:直接AM算法和嵌入半定松弛(semidefinite relaxation, SDR)的AM-R算法,后者通过Burer–Monteiro低秩因子化提高可扩展性。该框架被实例化为基于四元数(quaternion)的3D旋转搜索和6自由度(6-DoF)刚体配准。合成实验在外点率高达95%条件下评估,SIME方法始终取得竞争性或更优精度,高噪声下优势显著;在真实世界3DMatch扫描匹配基准上,SIME(AM)达到91.0%的平均配准成功率。论文发表在《Journal of Imaging》。
研究背景方面,三维配准广泛应用于点云对齐、物体姿态估计、机器人定位等任务。实际对应关系生成中常出现大量外点,例如因重复结构、部分重叠、遮挡或传感器噪声导致的错误匹配,使得标准最小二乘估计敏感,需鲁棒估计器。现有MC方法如RANSAC及其变种简单通用,但仅依赖硬内点计数,忽略残差大小;M估计器如截断损失方法可抑制大外点,但多侧重于参数估计或需定制求解器。由此,直接耦合内点识别与模型拟合的优化层公式仍需求迫切。研究人员围绕该问题开展研究,得出SIME框架在理论与实验上均优于MC的结论,重要意义在于提出一种可适用于旋转和刚体配准的统一高效方案。
主要关键技术方法包括:1) 截断损失公式,将内点残差大小融入目标函数;2) 交替最小化(AM)算法,交替更新二元内点变量和模型参数;3) 半定松弛(SDR)增强的AM-R算法,通过Burer–Monteiro低秩因子化(rank r = 2)将SDP子问题转化为无约束优化,并使用L-BFGS求解,大幅降低计算复杂度;4) 基于四元数的参数化表示,用于旋转搜索和刚体配准的残差建模。实验中数据来源为Stanford Bunny点云(用于合成实验)和3DMatch基准(含8个室内RGB-D扫描场景),对应关系通过3DSmoothNet描述子最近邻匹配生成。
研究结果:
3.1 旋转配准实验:在低噪声(σ=0.01)和高噪声(σ=0.04)条件下,比较RANSAC、GORE-RANSAC、快速全局配准(FGR)、QUASAR及所提AM与AM-R。结果显示,FGR在低外点率时良好,外点率超70%后性能下降;GORE-RANSAC优于RANSAC但逊于AM/AM-R;QUASAR、AM、AM-R在低噪声下性能接近,但在高噪声下SIME方法明显优于其他方法。运行时AM-R比QUASAR快约三个数量级(N=200时),得益于B-M因子化和稀疏结构利用。
3.2 6自由度欧几里得配准实验:额外估计平移,与TEASER++比较。结果表明FGR在高外点率高噪声时易失效;AM和AM-R在大多数情况下取得最高精度,尤其在高噪声条件下优势更显著,并大幅优于RANSAC和GORE-RANSAC;FGR和TEASER++效率更高,但SIME方法在精度上领先。典型例子显示AM在80%外点率下旋转和平移误差均远小于RANSAC。
3.3 截断?p损失实验:当内点噪声服从广义高斯分布(GDD)且形状参数v=0.5(超高斯)时,采用截断?p损失(p<2)比截断最小二乘(?2)损失精度更高,p=1.0时效果显著。
3.4 真实世界三维配准实验:在3DMatch基准上与RANSAC和TEASER++比较。SIME(AM)在所有8个场景中的平均配准成功率为91.0%,高于TEASER++的90.7%和RANSAC的86.7%,尽管运行时间略长。该结果验证了截断损失下同步内点选择与模型精化的有效性。
讨论部分指出,所提出的SIME框架是MC方法的有效替代,其残差感知的内点选择在高低异常值条件下带来更准的配准。局限性包括:依赖于截断参数γ的选择,过大或过小均可能影响性能;AM-R计算成本高于直接AM;非凸方法在极端噪声下受初始值影响。未来工作将聚焦自适应阈值选择、提高可扩展性及扩展到非刚性配准。
结论部分翻译:本文研究了一种基于截断损失的鲁棒三维配准公式,通过同步内点识别与模型估计(SIME)。与仅依赖硬内点计数的最大一致性方法相比,SIME在鲁棒模型拟合中可实现更低的拟合残差。为解决由此产生的非凸问题,研究人员开发了两种交替最小化方法,即直接AM算法和SDR增强的AM-R算法。研究人员将所提出框架实例化用于旋转配准和6自由度欧几里得配准。在合成和真实数据上的实验结果表明,所提出方法在高噪声和高外点率下具有很强的鲁棒性,并在代表性鲁棒配准方法中具有优势。定量上,在合成实验中,所提出方法在外点率高达95%时评估,始终取得竞争性或更优的精度,在高噪声设置中优势尤为明显。对于N=200的旋转配准,AM-R的速度比QUASAR快约三个数量级,同时保持相当精度。在真实世界3DMatch基准上,SIME(AM)达到了91.0%的最佳平均配准成功率。