大坝是重要的蓄水基础设施,其特点是规模庞大且投资巨大。由自然灾害引发的大坝溃坝洪水可能导致重大经济损失,威胁下游社区的安全,并造成严重的国家级损害。目前,中国拥有全球最多的水库大坝[[1], [2], [3]]。确保这些结构的安全运行不仅对经济发展至关重要,而且对于保护公共财产和维护社会稳定也必不可少[[4], [5], [6]]。混凝土大坝容易受到多种表面引发的损伤,包括裂缝、剥落、裸露的钢筋和沉淀物。在各种因素的影响下,这些损伤可能从表面发展到结构内部,甚至在极端情况下可能导致穿透性损伤和灾难性事故[7,8]。因此,定期监测和检测对于早期发现和减轻潜在危害至关重要。这些努力确保了结构的安全,最大化了工程效益,并支持了工业和农业的生产力[[9], [10], [11]]。然而,大坝体积庞大,检测区域广泛,且损伤位置随机。传统的人工检测方法存在相当大的局限性。大坝的规模、广阔且往往复杂的检测区域以及损伤位置的随机分布使得人工检测劳动强度高、耗时且效率低下。此外,这些方法严重依赖主观的人类判断,这影响了准确性和实时响应能力。恶劣的工作环境进一步增加了人员和操作安全的风险[[12], [13], [14], [15]]。这些挑战凸显了迫切需要智能损伤检测系统,以帮助工程师提高检测效率并降低成本。
计算机视觉领域的最新进展为非接触式的基于视觉的结构健康监测技术铺平了道路,这些技术为传统检测方法提供了有希望的替代方案[[16], [17], [18]]。这些技术利用视觉传感器捕捉图像,然后分析图像以识别损伤。传统的图像处理技术(IPTs)在检测特定类型的损伤(如裂缝[19])方面表现出有效性,但在复杂背景下难以识别多种损伤。此外,IPTs通常需要手动特征提取,并且处理速度慢,导致处理大量数据时效率低下[20,21]。
水上的混凝土大坝容易受到各种类型的损伤,这些损伤往往发生在视觉复杂的环境中,其中许多因素会干扰准确识别。例如,水渍、植被和其他障碍物可能会掩盖损伤,使损伤检测过程变得复杂[12,22]。当前的基于深度学习的损伤识别方法通常专注于每张图像检测一种类型的损伤。然而,在现实世界中,单个帧内经常同时存在多种类型的损伤,降低了这些方法的有效性和实用性。由此导致的低检测准确性限制了它们在实际工程中的应用。为了解决这些挑战,开发一种能够减轻背景干扰并准确识别单张图像中多种损伤类型的智能检测模型至关重要[23]。深度学习彻底改变了民用基础设施的无损评估,特别是在损伤检测方面。它提供了强大的特征学习能力,特别适合复杂的图像识别任务[24]。例如,Wang等人[25]利用深度学习实现了历史建筑的自动损伤识别。Xu等人[26]提出了一种改进的Faster R-CNN(基于区域的卷积神经网络)方法,用于检测和定位钢筋混凝土柱中的各种类型的地震损伤。Guzmán-Torres等人[27]应用迁移学习和超参数微调来校准CNN,用于分类沥青表面损伤。对于水下隧道检测,Li等人[28]开发了一个结合深度学习和计算机视觉技术的强大检测框架。Kang等人[29]将YOLOv8n-DCW与水下机器人结合,构建了一个用于水下大坝检测的智能检测平台,显著提高了检测准确性和效率。Hou等人[30]提出了一种基于深度学习和三维点云的水下桥梁缺陷识别方法。
无人机(UAV)已在多个领域得到广泛应用,包括航空摄影、农业、应急救援和电力检测。UAV因其高效、低成本和操作灵活性而受到青睐。它们还可以获取全面的数据,使其在各种应用中具有价值。在结构健康监测领域,UAV在桥梁损伤检测和识别[31,32]、自动建筑检测[33]和道路损伤评估[34]等任务中显示出巨大潜力。Akbar等人[35]研究了一种基于UAV的结构监测系统,该系统将捕获的图像拼接在一起,生成完整的结构概览。Qiu等人[36]使用结合YOLO框架的UAV图像实现了铺砌人行道中的实时裂缝检测。Mayya等人[37]提出了一种基于YOLO集成模型的三阶段裂缝检测框架,展示了YOLO在识别复杂土木工程结构表面缺陷方面的潜力。尽管取得了这些进展,但目前大多数基于UAV的损伤检测研究都集中在提高检测过程中收集的图像和视频数据的处理效率和准确性上。然而,在实际工程应用中仍存在挑战。一个重要的限制是UAV系统在飞行过程中无法进行实时损伤检测,导致识别结构问题的延迟。为了填补这一空白,应将智能检测模型直接集成到UAV平台中。这种集成使得能够实时准确地识别混凝土大坝的损伤,并进一步促进了完全自动化和高效的智能检测系统的发展。
为了解决上述挑战,本研究介绍了一种改进版的YOLOX(You Only Look Once X)深度学习目标检测模型[38],专门用于检测水面上的混凝土大坝损伤。首先,将高效通道注意力(ECA)机制[39]集成到网络架构中,以增强模型关注关键损伤特征的能力,从而提高检测性能。其次,采用α-GIoU(Alpha-Generalized Intersection over Union)[40,41]作为目标定位损失函数,以提高边界框回归的准确性。改进后的模型被嵌入到使用PyQt5(一个用于构建图形用户界面的Python库)开发的定制智能检测软件中,实现了从图像、视频和实时摄像头流中实时检测损伤。通过将此软件与UAV平台集成,构建了一个用于检测混凝土大坝表面损伤的智能检测系统。本研究的主要贡献如下:
1.本研究开发了一种改进的YOLOX模型,命名为YOLOXs-MDD(YOLOXs-Multiple Damage Detection)。该模型将ECA注意力机制集成到增强特征提取网络的输出特征图中。此外,原始的IoU损失函数被α-GIoU取代。这些改进专门优化了模型,以检测混凝土大坝的表面损伤。
2.在自建的混凝土大坝损伤数据集上进行了消融实验和比较实验。结果表明,所提出的修改显著提高了模型的检测能力,而注意力机制进一步增强了其专注度和可靠性,特别是在识别大坝损伤方面。
3.YOLOXs-MDD模型在测试集准确性上超过了五种著名的目标检测算法。其轻量级架构(8.94 MB)和低计算负担使其非常适合实时损伤检测任务。
4.使用PyQt5开发了检测软件,实现了与UAV系统的无缝集成。该软件支持本地图像/视频文件检测以及来自UAV的实时视频流分析,同时还显示和保存结果,以便实际工程应用。
本文的其余部分组织如下。第2节回顾了现有的混凝土大坝损伤检测研究。第3节介绍了所提出的智能检测系统,包括改进的检测算法和硬件集成。第4节描述了数据集构建过程和用于评估模型性能的评估指标。第5节展示了实验结果,包括模型训练、消融研究、比较分析以及在实际场景中的系统验证。最后,第6节总结了本文的主要发现。