
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于几何线索与物理先验的动态人体神经重建方法研究
【字体: 大 中 小 】 时间:2025年06月19日 来源:Pattern Recognition 7.5
编辑推荐:
针对动态人体重建中几何模糊性和颜色过拟合问题,清华大学团队提出HumanRecon方法,通过单目几何预测(深度/法线)约束神经辐射场(NeRF),结合视角噪声扰动和表面密度最大化物理先验,显著提升稀疏多视角下的重建精度与渲染鲁棒性,代码已开源。
在计算机视觉与图形学领域,高保真动态人体重建技术是推动虚拟现实(VR)、增强现实(AR)和数字人应用的核心挑战。现有方法主要依赖RGB颜色监督,缺乏显式几何约束,导致稀疏多视角下易出现几何模糊和颜色过拟合,如图1所示噪声敏感性问题。传统基于显式网格的方法需昂贵4D扫描设备,而PIFu系列虽实现高分辨率重建,却依赖地面真实几何数据。近期NeRF技术虽摆脱几何真值依赖,但存在辐射场噪声和视角过拟合缺陷。
清华大学团队在《Pattern Recognition》发表的研究提出HumanRecon框架,创新性地融合单目几何预测线索与物理先验。通过预训练模型获取深度/法线伪标签作为几何正则项,结合视角方向噪声扰动和射线表面密度最大化先验,显著提升动态人体重建质量。实验证明该方法在ZJU-MoCap等数据集上PSNR提升15%,且对低质量输入具有更强鲁棒性。
关键技术包括:1) 基于Animatable NeRF(Ani-NeRF)的基线模型;2) 采用BoostingDepth和NormalEstimator网络预测单目几何线索;3) 设计深度一致性损失Ldepth
和法线平滑损失Lnormal
;4) 引入视角噪声物理先验Lview
和表面密度约束Ldensity
。研究使用4个公开数据集验证,包含8-12相机阵列捕获的多视角视频。
【几何线索约束】
通过单目估计器获取的深度与法线信息,构建Ldepth
=||d?
-d||2
和Lnormal
=1-|n?
·n|损失函数。实验显示该约束使重建表面误差降低32%,特别是在服装褶皱等细节区域。
【物理先验设计】
在射线采样时添加高斯噪声δ~N(0,0.2)扰动视角方向,迫使网络学习视角不变特征。表面密度先验则通过最大化射线-表面交点处σ值,减少内部漂浮物伪影。消融实验表明二者联合使SSIM提升0.08。
【稀疏视角鲁棒性】
在仅4视角设置下,相比NARF基线PSNR提高4.2dB。法线估计的引入使足部等遮挡区域重建完整度提升41%,证实几何线索对稀疏数据的补偿作用。
该研究开创性地将可解释物理规则与数据驱动方法结合,为动态神经场重建提供新范式。深度/法线约束的引入突破传统NeRF对光度一致性的单一依赖,而物理先验设计则从渲染方程本质出发提升泛化性。未来可扩展至非刚性物体重建领域,但当前方法对快速运动模糊的处理仍有提升空间。作者指出,国家自然科学基金(U19B2036)和北京市自然科学基金(Z200002)的支持为跨学科研究提供了重要保障。
生物通微信公众号
知名企业招聘