探索建筑环境的核心目标是引导建筑机器人自主导航到未知区域并进行映射操作。这一过程扩展了已知区域,最终生成建筑环境的完整准确地图[[1], [2], [3], [4]]。此类探索是建筑机器人在复杂建筑现场执行任务的基本前提[5,6]。与单机器人系统相比,多机器人协作探索更为高效。此外,协作机制提高了容错性、可靠性和整体系统稳定性[7,8]。
在未知环境中进行多机器人探索的关键挑战是如何更有效地分配任务点[9]。有效的分配有助于减少对任务目标的冗余探索并提高计算效率。因此,任务分配方法必须适应建筑场景并具有高效率[[10], [11], [12], [13]]。目前,关于建筑机器人的任务分配研究,特别是在多机器人协作探索方面的研究仍然相对有限。Gerkey[14]将多机器人协作探索系统中的任务分配问题分为四种类型:单任务机器人、同构机器人、多机器人任务和时间扩展分配(ST-IR-MR-IA)。这个问题是NP难问题,因此没有一种通用方法能够在所有情况下保证最优解。为了应对这种复杂性,研究人员经常引入额外的约束来简化问题。这种策略在特定场景下能够产生性能更好的近似解。现有的任务分配方法可以分为元启发式方法、基于旅行商问题(TSP)的方法、基于市场和拍卖的方法、基于强化学习(RL)的方法以及基于效用价值(UV)的方法。
启发式方法[15]采用生物启发式算法,如粒子群优化和蚁群优化,来迭代优化任务分配。这种方法非常适合复杂的探索任务。然而,缺乏保证的最优性可能导致额外的资源消耗和更长的计算时间。基于TSP的任务分配方法[16]将问题表述为多旅行商问题(MTSP)或容量受限车辆路径问题(CVRP),以优化任务路径规划。这样的表述在平衡任务分配的同时最小化了总行驶距离。然而,高计算开销限制了其在实时应用中的实用性。基于市场和拍卖的方法[17]依靠经济原理通过机器人之间的竞价实现动态任务分配。这种机制容易受到策略性竞价的影响,从而可能破坏公平性和效率,并且还会产生大量的通信开销。基于RL的方法[18]应用强化学习在集中式或分布式框架中实现自适应任务分配。这些方法处理复杂环境时的推理成本较低,但训练计算成本较高且可扩展性有限。基于UV的方法[19]迭代更新目标效用并根据最优目标分配任务,确保每个决策步骤都是合理的。通过避免通信和竞价过程,这些方法显著减少了通信开销。它们的设计支持动态任务和实时响应。由于不需要全局最优路径和预训练,因此可以直接部署。然而,通常需要针对不同场景进行定制。效用价值函数中包含的因素类型和优先级也因应用而异。此外,基于UV的方法通常需要与目标生成方法和策略优化方法集成,以实现最佳性能。
波前边界检测(WFD)[20]是一种经典的目标生成方法。其核心思想是识别已知和未知空间区域之间的边界(称为“边界”),并将其作为探索目标点。Yan等人[21]将WFD的基于BFS的边界检测与Mean-Shift聚类相结合,提取具有代表性的边界簇。然后使用信息增益和路径距离等效应价值函数构建成本矩阵。采用匈牙利算法获得最优任务分配,实现多机器人协作探索。Zhong等人[22]将WFD边界检测与UV优化相结合。具体来说,使用波前扩展在OctoMap中检测前沿边缘,通过Fast Marching计算ESDF内的飞行时间,并评估效应价值函数R(P)。Sumer等人[23]改进了EWFD波前扩展,以识别领先点并评估效应价值函数R(P),从而将任务有效地分配给具有最高效应价值的点。建筑任务通常具有严格的时间限制,例如混凝土浇筑或墙壁喷涂[24]。因此,算法需要考虑任务之间的时间敏感性。此外,建筑现场规模庞大且复杂。在这些条件下,上述WFD + UV方法在探索过程中经常会经过未知的边界特征点(例如中点或质心点)。这种行为会导致小规模边界区域的冗余覆盖,并增加整体探索时间。
在效用价值(UV)优化中集成多策略时,Zhang等人[25]研究了四种环境策略融合方法来构建效用价值函数。他们的方法将探索时间减少了约20%–30%,路径长度缩短了25%–35%。Bi等人[26]采用了动态Voronoi划分与分层LEW/GEW探索和非参数效用函数f。通过整合任务划分、信息增益和距离成本的三方策略优化了UV。Li等人[27]整合了拓扑结构、空间增益和路径成本。提出了一种图增益效用函数,以解决传统RRT方法中遗漏边界的问题,并在单机器人静态环境(室内/车库/隧道)中验证了其有效性。Quin等人[28]融合了三种策略——EWFD、活跃区域和增量检测——将复杂性降低到O。在单静态地图(弗莱堡走廊、校园)上展示了高效稳定的边界检测。Liu等人[29]设计了一种包含信息增益、路径长度和航向成本的效用价值函数,实现了在单静态办公地图上的平稳高效探索。Pongsirijinda等人[30]将MWF边界检测、路径距离、颜色噪声和安全距离结合到一个统一的效用函数中,这在室内走廊和障碍物场景中显示出大约30%的探索鲁棒性提升。尽管取得了这些进展,但在复杂建筑环境中应用多策略融合UV优化仍然具有挑战性。建筑现场危险性较高,因此在探索过程中必须优先考虑安全。然而,大多数现有方法没有包括建筑机器人与移动人员、设备、现有结构和堆叠组件等障碍物之间的安全距离约束。为了满足碰撞检测要求,探索算法应结合多段几何建模。此外,建筑环境具有高度动态性。大多数先前的研究仅在单静态地图上得到验证,这限制了其对多阶段建设和多种障碍物类型的适应性。最后,针对建筑现场的多机器人多策略优化和任务协调的系统方法仍然不完善。当效用值相似时,在冲突分配和多任务优先级调度方面仍存在明显差距。
本文的目标是开发一种适用于建筑环境的多机器人协作环境探索任务分配方法,该方法既高效又实用。所提出的框架整合了边界体积层次结构(BVH)障碍物检测机制、基于边界过滤和质心提取的目标生成方法以及多策略融合UV任务分配模型。这些组件共同实现了在复杂建筑场景中多机器人的高效协作调度。本文的关键贡献包括:
(i) 开发了一种基于BVH的碰撞检测方法,可以同时处理轴对齐边界框(AABB)和圆柱形障碍物表示。该方法结合了碰撞安全距离约束,消除了多次临时几何检查的需要。
(ii) 优化了WFD的目标生成机制。提出了一种结合边界过滤和质心点提取的方法,以减少冗余探索并降低计算开销。
(iii) 通过整合折扣信息增益、改进的运动成本、基于角度的成本吸引力和强制距离最大化分布策略,优化了基于UV的任务分配算法。这种设计提高了全局任务分配效率并提升了探索效果。
本文的其余部分结构如下。第2节介绍了所提出的I-WFD-UV框架的总体方法论,包括WFD-UV算法的基本原理、基于BVH的障碍物处理、改进的基于边界的任务生成机制、多策略融合效用价值任务分配模型以及数字孪生实现。第3节描述了用于在不同建筑阶段验证所提方法的仿真设置和实验场景。第4节通过消融研究和性能比较报告和讨论了实验结果。最后,第5节总结了本文并概述了未来研究的潜在方向。