
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于半监督双路径YOLOv8模型的地下缺陷智能检测方法研究
【字体: 大 中 小 】 时间:2025年06月20日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
针对地下空洞检测中GPR图像人工解译效率低、主观性强的问题,浙江大学团队提出融合注意力机制与轻量化设计的半监督双路径YOLOv8模型。通过物理模拟数据预训练和CycleGAN生成伪标签数据,模型准确率提升显著,为城市地下安全隐患智能识别提供新范式。
城市地下空间如同人体的血管网络,其健康状况直接关系到地表安全。近年来,因地下空洞引发的道路塌陷事故频发,仅2022年中国就报告了37起重大塌陷事件。探地雷达(Ground Penetrating Radar, GPR)作为"地质CT",虽能探测地下异常,但其图像解译长期依赖工程师经验——这好比让医生仅凭肉眼判断X光片,既容易漏诊又效率低下。更棘手的是,地下缺陷样本稀缺且分布未知,传统监督学习模型常陷入"数据饥渴"困境。
针对这一系列挑战,浙江大学的研究团队在《Engineering Applications of Artificial Intelligence》发表创新成果。他们巧妙融合物理规律与人工智能,开发出半监督双路径YOLOv8模型。该模型通过"两条腿走路":一条是搭载卷积注意力模块(CBAM)的精密路径,能像经验丰富的专家般捕捉缺陷特征;另一条采用MobileNet的轻量化路径,则如同便携式检测仪,兼顾效率与精度。研究团队还创新性地引入两阶段数据增强策略:先用基于电磁波理论的gprMax模拟数据"教"模型认识典型缺陷,再通过具备循环一致性的CycleGAN生成逼真伪样本,最终在杭州实际工程中实现94.3%的检测准确率,比传统YOLOv5提升12.6%。
关键技术方法
研究采用实测GPR图像(583张,1280×570像素)与gprMax模拟数据结合构建初始数据集。模型开发包含:1)双路径YOLOv8架构设计,分别集成CBAM注意力模块和MobileNet轻量化网络;2)基于CycleGAN的伪标签生成,通过循环一致性损失保障图像质量;3)半监督训练框架,分阶段融合模拟数据与伪标签数据。实验使用NVIDIA RTX 3090 GPU,评估指标包括mAP、FPS及参数量。
研究结果
方法论
提出标准YOLOv8的改进方案:注意力路径通过CBAM模块提升特征选择能力,轻量路径采用深度可分离卷积减少70%参数量。CycleGAN在图像转换中引入周期一致性损失,使生成图像与真实GPR数据的结构相似性指数(SSIM)达0.82。
实测数据集
收集浙江地区城市道路/高速公路的583幅GPR图像,包含空洞、管道等目标。由于实际缺陷样本仅占12%,采用数值模拟生成不同介电常数、尺寸的腔体图像扩充数据。
半监督学习模型验证
三阶段实验显示:仅用实测数据(DS1)的mAP为82.4%;加入模拟数据(DS2)后提升至89.1%;融合伪标签数据(DS3)最终达到94.3%。注意力版本在精度上优于轻量版3.2%,但后者推理速度达156 FPS,更适合移动端部署。
结论与意义
该研究突破性地将物理规律嵌入深度学习框架:1)双路径设计平衡精度与效率,CBAM模块使模型聚焦缺陷特征,MobileNet实现参数压缩;2)gprMax模拟提供物理约束,避免纯数据驱动的过拟合;3)CycleGAN的半监督策略解决样本稀缺难题。建立的综合雷达数据集已开源,涵盖实测/模拟/CycleGAN生成三类图像,为后续研究提供基准。实际工程应用表明,该模型可自动识别80cm深度内的空洞,预警准确率达91%,较人工检测效率提升20倍,为智慧城市地下安全监测提供可靠技术支撑。
生物通微信公众号
知名企业招聘