融合三维几何与机器学习：多视角立体视觉中几何一致性的多尺度协同优化

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年08月23日 来源：Neurocomputing 6.5

编辑推荐：

　　本文推荐：作者提出GC-MVSNet++，首次在训练阶段通过多视角（multi-view）、多尺度（multi-scale）几何一致性（GC）模块主动强化深度图一致性，结合创新的密集连接成本正则化网络（dense-CostRegNet），将训练迭代次数减少50%，并在BlendedMVS数据集实现SOTA（state-of-the-art）性能。

亮点

• 我们提出创新的多视角、多尺度几何一致性模块（GC-MVSNet++），在训练过程中直接强化几何一致性，而非仅作为后处理步骤。

• 该方法使训练迭代次数减半，同时提升重建精度，堪称“几何约束驱动的加速学习典范”。

• GC模块可灵活嵌入其他多视角立体视觉（MVS）流程，还能预处理剔除真实数据中的几何不一致像素。

• 设计新型密集连接成本正则化网络（dense-CostRegNet），包含简单模块（高效编码）和特征密集模块（精准解码）。

讨论

GC-MVSNet++ vs. MVSFormer系列：MVSFormer依赖预训练模型和全局Transformer，而GC-MVSNet++仅用单层全局特征聚合，通过几何一致性损失实现更高效的训练。实验表明，我们的方法在复杂场景下更具鲁棒性，尤其在遮挡区域重建效果显著提升。

结论

本研究提出的GC-MVSNet++首次在训练中显式建模多视角、多尺度几何一致性，结合独创的双模块密集连接网络，为学习型MVS提供了新范式。其“几何损失引导+密集特征流”的设计思路，为三维重建领域开辟了更高效的优化路径。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号