基于多标签图割的多视角全景图像室内布局精确估计方法研究

【字体: 时间:2025年08月16日 来源:International Journal of Applied Earth Observation and Geoinformation 8.6

编辑推荐:

  研究人员针对单幅全景图像易受遮挡导致室内布局估计不准确的问题,提出了一种基于多标签图割(multi-label graph cut)的多视角全景图像融合方法。通过预训练模型获取初始布局标签,结合几何感知光线投射(geometry-aware ray-casting)生成初始平面图,再经多标签图割优化实现布局正则化。实验表明,该方法在HM3D-MVL等数据集上2D IoU指标最高提升11.94,显著优于HorizonNet等单视角方法及现有自训练模型,为无标注数据下的三维环境重建提供了新思路。

  

在室内三维重建领域,精确的房屋布局估计是构建数字孪生环境的基础。然而,传统基于单幅全景图像的方法易受家具或墙体遮挡影响,而深度学习模型在新场景中泛化能力有限。针对这一难题,智能中原地理信息技术协同创新中心(Collaborative Innovation Center of Geo-Information Technology for Smart Central Plains)的研究团队在《International Journal of Applied Earth Observation and Geoinformation》发表创新成果,提出了一种融合多视角全景图像与多标签图割的解决方案。

研究团队采用三步核心技术:首先利用预训练模型(HorizonNet/LGTNet)获取单视角布局估计;其次通过几何感知光线投射生成初始平面图;最后构建包含距离代价(D(Fm,lm))和平滑约束(Slm!=ln)的能量函数,采用α-expansion算法进行多标签图割优化。实验数据来自HM3D-MVL、MP3D-FPE和ZInD三大数据集,涵盖46-56个多视角全景图像。

研究结果显示:在HM3D-MVL数据集上,该方法2D IoU达88.65%,较单视角方法提升9.75-11.94;在非曼哈顿场景中,通过取消相邻墙体垂直假设,成功重建倾斜墙体结构(图10);针对ZInD数据集仅有6个视角的挑战,仍保持78.08%的2D IoU精度。特别值得注意的是,该方法在遮挡区域(图8沙发遮挡处)和复杂转角(图12非立方体场景)的表现均优于对比方法。

讨论部分指出,当前方法对不规则天花板结构的处理存在局限,未来可发展地板-天花板双路径分析框架。该研究的意义在于:首次将多标签图割引入多视角布局融合,在无需标注数据的前提下,实现了对复杂室内场景的精确重建,为应急响应规划等地理信息应用提供了可靠技术支撑。运行时间测试显示单幅图像处理仅需115-162ms,具备实际部署价值。研究还发现,即使仅使用60%的候选标签线,精度损失仍控制在0.5%以内(表6),证明了算法的鲁棒性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号