快速且精确的参数转换方法,适用于参数化人体模型

《Proceedings of the ACM on Computer Graphics and Interactive Techniques》:Fast and Accurate Parameter Conversion for Parametric Human Body Models

【字体: 时间:2025年11月07日 来源:Proceedings of the ACM on Computer Graphics and Interactive Techniques

编辑推荐:

  本文提出了一种基于深度学习的实时参数转换方法,用于在SMPL家族的不同人体模型(如SMPL、SMPL+H、SMPL-X、STAR和SUPR)之间转换翻译、形状和姿态参数。该方法通过全连接神经网络实现,在保持转换精度的同时显著降低计算时间,适用于实时场景。实验表明,该方法在转换精度上与现有优化方法相当,但速度提升达多个数量级。此外,该方法在数字人双胞胎实时流媒体系统中进行了验证,支持高帧率(120Hz)传输并生成转换质量反馈,便于下游系统调整。

  在现代计算机视觉和计算机图形学领域,人类身体模型在多个应用中发挥着重要作用,例如动作捕捉、3D人体姿态和形状估计、动画生成以及数字孪生系统等。这些模型通常基于参数化方法构建,其中最著名的一类是SMPL(Skinned Multi-Person Linear)模型及其变种,如SMPL+H、SMPL-X、STAR和SUPR等。这些模型能够通过少量参数(如形状参数、姿态参数和位移参数)高效地表示复杂的人体几何形状和运动状态。然而,由于不同身体模型的结构、关节分布和参数空间存在差异,直接在不同模型之间进行参数转换时会遇到兼容性问题。也就是说,使用某一模型的参数作为另一模型的输入,通常无法产生相同的视觉效果。这一问题在跨模型的数据融合、共享和处理流程中尤为突出,限制了不同模型间的互操作性。

为了应对这一挑战,研究者们提出了多种参数转换方法,其中优化方法因其高精度而被广泛采用。然而,这些方法在处理实时数据或大规模数据集时存在显著的计算瓶颈,导致运行时间较长,难以满足实时应用的需求。本文提出了一种基于深度学习的参数转换方法,该方法在保持转换精度的同时,显著提升了处理速度,使得在实时场景中不同身体模型间的参数转换成为可能。此外,本文还展示了该方法在数字人孪生(Digital Human Twin)系统中的应用,为实时数据流和可视化提供了支持。

### 身体模型的多样性与兼容性挑战

SMPL模型家族因其简洁的参数化表示和高效的计算特性,成为人体建模领域的主流选择。不同模型之间的差异主要体现在以下几个方面:

1. **关节结构**:SMPL模型通常包括24个关节,而SMPL+H则增加了30个关节以支持手部运动,SMPL-X进一步引入了3个额外的头部关节,用于面部和眼睛的运动控制。
2. **形状空间**:所有模型都基于形状参数(β)进行表示,但这些参数的学习来源和数量可能不同。例如,SMPL-X和SUPR使用了更复杂的形状参数集合,而其他模型可能仅使用较少的形状参数。
3. **姿态参数**:姿态参数(θ)通常由关节的旋转向量构成,不同模型的关节数量决定了姿态参数的维度。SMPL和STAR使用稀疏的姿态参数,而SMPL-X和SUPR则支持更密集的姿态表示。
4. **坐标系**:不同数据集的坐标系可能不一致,这会影响模型的兼容性。例如,AMASS数据集和Motion-X数据集在坐标表示上存在差异,需要在训练前进行转换以确保一致性。

由于这些差异,直接使用某一模型的参数作为另一模型的输入会导致视觉效果不一致。例如,SMPL模型的关节结构和参数空间与STAR模型不同,如果直接使用SMPL的参数来驱动STAR模型,可能会出现明显的形状或姿态失真。因此,参数转换成为实现跨模型数据共享和处理的关键步骤。

### 参数转换方法的演进与挑战

早期的参数转换方法主要依赖于优化算法,例如基于梯度下降的最小二乘法。这些方法虽然能够实现高精度的参数转换,但其计算复杂度较高,尤其在处理大规模数据集或实时应用时表现不佳。优化方法通常需要对每个参数进行逐个调整,以确保输出模型的形状和姿态与输入模型尽可能接近,这种逐个优化的过程在实时数据流中难以实现。

近年来,研究者们开始探索基于机器学习的方法,尤其是深度学习技术,以提升参数转换的效率和准确性。这类方法通常通过训练神经网络来学习不同模型之间的参数映射关系。相比于优化方法,神经网络具有更高的计算效率,可以在单次网络前向传播中完成多参数的转换,从而显著减少处理时间。然而,这些方法仍然面临一些挑战,例如如何处理不同模型之间的结构差异、如何确保转换结果的准确性、以及如何在训练过程中利用有效的监督信号。

### 本文提出的深度学习参数转换方法

本文提出了一种基于深度学习的参数转换方法,该方法通过一个全连接神经网络(Fully Connected Neural Network)实现不同SMPL模型之间的参数转换。该网络可以同时处理翻译(γ)、形状(β)和姿态(θ)参数,并将这些参数映射到目标模型的参数空间。为了提升转换的准确性,本文还引入了“直接传输模块”(Direct Transfer Module, DTM),该模块可以处理不同模型之间的关节结构差异,例如删除或添加不匹配的关节参数,从而确保输入参数与目标模型的结构兼容。

在训练过程中,本文采用了两种主要的监督信号:均值每顶点位置误差(Mean Per Vertex Position Error, MPVPE)和均值每边误差(Mean Per Edge Error, MPEE)。MPVPE用于衡量转换后的顶点位置与真实顶点之间的差异,而MPEE则用于评估边的变形是否合理。通过结合这两种误差指标,本文能够全面评估转换结果的质量,并为后续的处理流程提供反馈。

此外,本文还展示了一种实时流媒体应用,该应用可以将不同模型的参数转换为统一的表示形式,并在120 Hz的帧率下进行实时传输和可视化。这一应用对于数字人孪生系统具有重要意义,因为数字人孪生通常需要在多个设备之间进行实时同步,而参数转换的低延迟和高精度是实现这一目标的关键。

### 实验与结果分析

为了验证本文方法的有效性,我们进行了广泛的实验,涵盖了多个数据集,包括AMASS和Motion-X等。实验结果显示,本文方法在保持较高转换精度的同时,显著提升了处理速度。例如,在SMPL到SMPL+H的转换任务中,本文方法的转换误差比优化方法减少了约3.0 mm,而处理时间则从数小时减少到数秒。此外,本文还展示了在不同数据集(如AGORA和3DPW)上的泛化能力,表明该方法不仅适用于训练数据,还能在未见过的数据上保持较高的转换质量。

然而,本文方法也存在一些局限性。例如,对于完全随机采样的输入数据,转换结果可能不够理想。此外,该方法目前无法处理基于PCA子空间表示手部姿态的数据,且依赖于已知的顶点对应关系进行训练。因此,对于新类型的模型,需要预先计算顶点对应关系,并确保其参数可控制。未来的研究可能会探索如何改进这些方面,例如引入更高效的反馈机制,或利用随机采样的数据提升模型的泛化能力。

### 实际应用与未来展望

本文方法的一个重要应用是在数字人孪生系统中实现参数的实时转换。通过将不同模型的参数转换为统一的表示形式,该方法能够支持多模型间的实时数据流和可视化。在实验中,我们模拟了数字人孪生的流媒体场景,并展示了如何在120 Hz的帧率下进行参数转换。此外,本文还讨论了如何在不同的计算资源条件下选择参数转换的位置(例如在服务器端进行转换,或仅在需要的客户端进行转换),以优化系统性能。

未来的工作将探索如何进一步提升转换反馈的效率,并研究如何利用随机采样的运动数据来增强模型的泛化能力。此外,本文方法目前为男性和女性模型分别训练了独立的转换网络,但未来可以探索性别无关的转换模型,以减少训练成本。同时,我们还考虑了如何利用可逆神经网络或共享的形状和姿态嵌入来减少需要训练的转换方向数量,从而进一步优化模型结构。

### 结论

本文提出了一种基于深度学习的参数转换方法,能够高效地在不同SMPL模型之间进行参数映射。该方法在保持较高转换精度的同时,显著提升了处理速度,使其适用于实时数据流和大规模数据集。通过在数字人孪生系统中的应用,本文展示了该方法在实际场景中的价值。未来的研究将致力于进一步优化该方法,使其能够更好地适应不同类型的模型,并在更广泛的应用场景中发挥潜力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号