
-
生物通官微
陪你抓住生命科技
跳动的脉搏
融合三维几何与机器学习:多视角立体视觉中几何一致性的多尺度协同优化
【字体: 大 中 小 】 时间:2025年08月23日 来源:Neurocomputing 6.5
编辑推荐:
本文推荐:作者提出GC-MVSNet++,首次在训练阶段通过多视角(multi-view)、多尺度(multi-scale)几何一致性(GC)模块主动强化深度图一致性,结合创新的密集连接成本正则化网络(dense-CostRegNet),将训练迭代次数减少50%,并在BlendedMVS数据集实现SOTA(state-of-the-art)性能。
亮点
• 我们提出创新的多视角、多尺度几何一致性模块(GC-MVSNet++),在训练过程中直接强化几何一致性,而非仅作为后处理步骤。
• 该方法使训练迭代次数减半,同时提升重建精度,堪称“几何约束驱动的加速学习典范”。
• GC模块可灵活嵌入其他多视角立体视觉(MVS)流程,还能预处理剔除真实数据中的几何不一致像素。
• 设计新型密集连接成本正则化网络(dense-CostRegNet),包含简单模块(高效编码)和特征密集模块(精准解码)。
讨论
GC-MVSNet++ vs. MVSFormer系列:MVSFormer依赖预训练模型和全局Transformer,而GC-MVSNet++仅用单层全局特征聚合,通过几何一致性损失实现更高效的训练。实验表明,我们的方法在复杂场景下更具鲁棒性,尤其在遮挡区域重建效果显著提升。
结论
本研究提出的GC-MVSNet++首次在训练中显式建模多视角、多尺度几何一致性,结合独创的双模块密集连接网络,为学习型MVS提供了新范式。其“几何损失引导+密集特征流”的设计思路,为三维重建领域开辟了更高效的优化路径。
生物通微信公众号
知名企业招聘