MSMC-U-Net:融合多尺度特征与上下文分析的基础设施裂缝精准分割新方法

【字体: 时间:2025年06月22日 来源:Expert Systems with Applications 7.5

编辑推荐:

  针对基础设施裂缝检测中人工效率低、误差率高的问题,研究人员提出MSMC-U-Net模型,集成Transformer、CBAM、FPP和ASPP模块,实现多尺度特征与长程依赖分析。在CrackSeg9k和CSD数据集上取得mIoU 94.29%和92.36%的优异性能,为自动化结构健康监测提供高效解决方案。

  

混凝土结构裂缝是基础设施老化的早期信号,但传统人工检测方法效率低下且易受主观影响。随着深度学习发展,尽管已有基于CNN和Transformer的裂缝检测模型,仍面临泛化性差、计算成本高、可解释性不足等挑战。例如,MultiScaleCrackNet虽能分类裂缝,但难以适应复杂环境变化;现有模型在重叠裂缝或噪声干扰下的性能急剧下降。这些瓶颈严重制约了自动化检测技术在桥梁、隧道等关键场景的应用。

为解决上述问题,研究人员开发了MSMC-U-Net模型。该研究通过三阶段框架实现突破:数据预处理阶段采用归一化与几何增强提升数据鲁棒性;特征提取阶段创新性融合Transformer(捕获长程依赖)、CBAM(空间-通道注意力)、FPP(特征金字塔池化)和ASPP(空洞空间金字塔池化)四大模块;分割阶段通过U-Net解码器实现特征融合与上采样。实验使用CrackSeg9k和CSD公开数据集验证性能。

Related work
现有研究可分为传统图像处理与深度学习两类。前者依赖边缘检测和阈值分割,但难以应对复杂背景;后者如Arafin等提出的语义分割模型虽精度较高,但计算复杂度成瓶颈。Russel & Selvaraj的MultiScaleCrackNet通过并行多尺度CNN降低计算量,却牺牲了小裂缝检测能力。这些工作凸显了精度与效率平衡的重要性。

Methodology
MSMC-U-Net的核心创新在于多模块协同:Transformer编码器分析像素序列全局关系;CBAM通过通道注意力(CAM)和空间注意力(SAM)聚焦关键区域;FPP与ASPP分别通过金字塔池化和不同膨胀率的空洞卷积捕获多尺度特征。这种设计首次在裂缝分割中实现局部细节与全局上下文的动态平衡。

Experimental results
在CrackSeg9k测试中,模型以96.87%精度、95.36% OIS(最优图像尺度)显著优于基线;CSD数据集上保持95.44%精度且推理速度达21FPS。消融实验显示,移除CBAM会使mIoU下降3.2%,证明注意力机制对复杂裂缝的有效性。与DeepCrack和CrackNet相比,该模型在光照变化场景的AP(平均精度)提升达8.7%。

Conclusions
该研究通过MSMC-U-Net实现了三大突破:首次将Transformer与CBAM结合用于裂缝分割,建立长程依赖与局部注意力的协同机制;多尺度模块(FPP/ASPP)使模型能同时检测0.1-5mm宽度的裂缝;轻量化设计使推理速度满足实时需求。这些进展为基础设施智能巡检提供了新范式,未来可通过迁移学习扩展至金属腐蚀等衍生缺陷检测。

值得注意的是,研究存在未标注作者单位的局限,且未公开训练代码。但模型在跨数据集测试中的稳健表现(CS9k→CSD迁移仅下降1.8% mIoU),证实其具备较强的泛化能力。这项工作发表于《Expert Systems with Applications》,为计算机视觉与土木工程的交叉研究树立了新标杆。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号