随着建筑项目的复杂性和规模的增加,对有效且可靠的监控方法的需求也在增长。施工现场监控对于跟踪项目进度、确保进度合规性以及识别可能影响整体生产力的低效率或延误至关重要[[1], [2], [3], [4]]。此外,有效的监控对于通过及时发现可能导致事故或伤害的危险情况来维护现场安全尤为重要。尽管现场监控至关重要,但依赖人工观察的传统方法受到人为错误的限制,且无法提供连续覆盖,尤其是在大规模或复杂的环境中。基于视觉的监控技术的最新进展显著增强了识别和分析各种建筑活动的能力[[5], [6], [7]]。特别是基于计算机视觉技术的自动化监控系统能够实现连续和客观的现场观察,从而减少了对人工检查的依赖,并提高了准确性和效率[[8], [9], [10]]。通过实现可靠和连续的现场观察,这些自动化系统帮助施工管理人员及时识别潜在危险和流程中断。然而,尽管取得了显著进展,但对于某些需要精确空间理解和上下文意识的关键监控任务,现有自动化方法仍然具有挑战性。
在各种建筑监控任务中,检测和跟踪悬挂物体(如通过塔式起重机提升和运输的材料)对于确保安全和生产力至关重要[[11], [12], [13]]。在此背景下,悬挂物体被定义为任何通过起重机绳索悬挂且明显与地面或其他支撑结构分离的材料或部件。这一定义仅关注物体的提升状态,而不考虑其具体类型或大小。提升作业通常在工人视野受限的位置进行,增加了悬挂材料引发事故的风险。对这些物体的实时监控不足可能导致严重伤害或死亡,这突显了在高风险建筑环境中系统观察的必要性[[14], [15], [16]]。除了安全问题外,有效监控提升作业对于保持工作流程效率和减少延误也很重要。适当的协调和及时处理材料有助于防止施工活动中的不必要的中断,从而提高整体现场生产力[17,18]。悬挂物体的自动化检测和跟踪使施工管理人员能够优化起重机调度、协调材料流动,并实时做出明智决策,直接促进更高效和可靠的施工过程。鉴于准确可靠地检测悬挂物体的重要性日益增加,显然需要开发能够替代人工观察并提高施工现场监控整体效率的自动化检测系统。
然而,传统的物体检测模型在识别施工现场的悬挂物体时面临重大挑战。这些模型主要依赖于形状、纹理或颜色等视觉外观线索,这些线索往往不足以区分由塔式起重机悬挂的物体和放置在地面上的物体。由于悬挂物体通常与地面物体具有相似的视觉特征,标准的基于RGB的检测方法难以准确推断其状态。这些模型的主要挑战在于它们无法解决视觉模糊性,并在视觉复杂的建筑环境中可靠地推断物体的上下文相关状态[19]。此外,施工现场遇到的各种物体为传统检测方法带来了额外的挑战。考虑到需要提升操作的多种材料和设备(包括梁、面板、容器和预制组件),预先定义和标注所有可能的提升物体类别往往不切实际。这限制了基于类别的识别方法在现实世界条件下的适用性。先前的研究进一步证实,即使是专为类别识别设计的最先进的物体检测器,也无法高可靠性地推断物体的悬挂状态。这些关键限制凸显了需要从基于外观的、特定类别的检测转向基于状态的检测范式的必要性,后者侧重于推断物体是否处于悬挂状态,而不是识别其类别。这种转变使模型能够泛化到不同的物体类型,并在动态和视觉复杂的建筑环境中提供更多与安全相关的信息。此外,悬挂物体与其周围背景之间的频繁接近和视觉相似性使得基于外观的模型难以清晰地划定物体边界或解释它们在场景中的上下文关系。这些挑战强调了从传统检测方法向能够稳健推断建筑现场复杂视觉环境中物体操作状态的基于状态的检测方法发展的必要性。
为了解决这一研究空白,悬挂物体检测已成为一个新挑战,需要能够准确推断复杂场景中物体悬挂状态的模型。之前的研究[19]引入了HangCon(建筑现场悬挂物体)基准数据集,作为建筑环境中悬挂物体的专用资源,提供了涵盖多种现实世界场景的全面注释。在此基准的基础上,本文提出了一种深度感知检测框架,该框架利用深度信息通过引入HODNet(悬挂物体深度感知特征模块)来识别悬挂物体,该模块旨在分析物体与其周围环境之间的深度差异。为了进一步提高基于深度的推理可靠性,引入了一个基于分割的深度预处理流程来细化物体边界并提高单目深度图的质量。在此基础上,HODNet被集成到基线检测网络中。整个模型使用了一个复合损失函数进行了优化,该函数包含了专为悬挂物体检测定制的深度一致性正则化项。通过在建筑现场悬挂物体场景的专用数据集上进行全面的消融研究和实验,验证了所提出方法的有效性。实验结果表明,所提出的方法显著提高了检测性能和在实际建筑环境中的自动化监控实用性。
本文通过提出HODNet为该领域做出了贡献,该模型旨在提高复杂建筑场景中悬挂物体的识别能力。通过利用深度变化和细化物体边界,所提出的模型能够更准确地识别悬挂物体。实验结果表明,所提出的方法优于现有的基于外观的检测器,突显了专门建模的重要性以及单目深度信息在推断物体悬挂状态方面的有效性。总体而言,本文为推进悬挂物体检测研究和发展更强大的建筑现场自动化视觉监控系统奠定了基础。通过实现更准确的安全监控和改进塔式起重机操作的过程管理,所提出的框架支持实现更安全和更高效的施工流程。