随着智能交通和基础设施数字化的不断推进,路面裂缝检测已成为土木工程和计算机视觉交叉领域的一个有前景的研究课题。开发此类检测方法对于提高道路安全性、延长使用寿命和降低维护成本具有重要意义。
然而,与结构裂缝相比,路面裂缝通常更细且形态更加不规则。它们还受到环境光照、噪声和水渍的严重影响(Park和Kim,2015)。此外,裂缝区域与背景之间的对比度低进一步增加了检测难度。现有的深度学习模型在面对复杂背景和极细裂缝时仍存在稳定性不足、边缘模糊或漏检的问题。
最近基于深度学习的方法在裂缝分割方面取得了显著进展。早期的方法采用了全卷积网络(FCN)(Dai等人,2016)和U-Net(Ronneberger等人,2015),实现了裂缝图像的高精度分割。进一步的发展引入了多尺度特征提取和注意力机制,以改善细裂缝结构的表征。例如,DeepCrack(Zou等人,2018)通过多尺度输出增强了分割效果。Transformer(Vaswani等人,2017)在全局依赖性建模方面表现出色,进一步推动了裂缝分割技术的发展。代表性的例子包括CrackFormer(Liu等人,2021),以及将Transformer模块集成到U形网络中的混合架构,如SwinUNet(Cao等人,2022)和TransUNet(Chen等人,2021)。
最近,以Mamba为代表的状态空间模型(SSM)成为一种有前景的方法。Mamba(Gu和Dao,2023)通过选择性机制和硬件优化提高了建模效率,在音频和文本建模等数据密集型任务中表现出色。计算复杂度降低到线性时间,同时保持了捕捉长距离依赖性的能力。Vision Mamba(VMamba)(Liu等人,2024)通过引入Cross Scan Module(CSM)将SSM的应用扩展到视觉任务中。特别是,图像被转换为序列,这种方法在裂缝分割中的有效性已得到初步验证(Han等人,2024;Liu等人,2025;Qi等人,2024)。
然而,当前的VMamba架构主要针对全局特征建模设计,其模块优化了长距离依赖性建模,导致在捕捉细粒度局部结构(如裂缝边缘和形态变化)方面的性能有限。因此,对于小型、连续和细长的裂缝模式的准确建模仍然不足。
为有效解决这些限制,本文基于DeepCrack框架开发了一种新的路面裂缝分割网络。编码器采用了一种混合VMambaConv模块,结合了Vision Mamba和卷积操作来共同建模全局依赖性和局部空间细节。瓶颈层引入了WDcascade模块,通过多频率、方向特征学习和自适应门控融合来增强非结构化裂缝的建模。解码器利用基于CNN的上采样策略,合并来自不同编码器-解码器阶段的特征,并结合多尺度深度监督来提高分割性能。
我们方法的主要贡献可以总结如下:
1. 提出了一种用于路面裂缝分割的VMFDF-Net架构,该架构结合了全局上下文建模和局部细节表征。通过将基于Vision Mamba的全局建模与卷积局部特征提取相结合,构建了一个混合编码器,并在瓶颈层采用了多频率方向建模策略,以综合考虑全局和局部裂缝特征。
2. 设计了VMambaConv模块来增强空间特征表征。为了弥补Vision Mamba在局部细节建模方面的局限性,采用了由深度卷积、状态空间建模和残差连接组成的序列结构,实现了局部纹理和长距离依赖性的联合建模。
3. 引入了基于多频率方向建模的WDcascade瓶颈模块。将小波卷积的多频率分析能力与动态蛇形卷积的方向感知能力相结合,并使用自适应门控机制实现了不同频率和方向特征的加权融合。
4. 在多个公共裂缝分割数据集上进行了广泛实验。结果表明,所提出的方法在多个评估指标上均取得了有竞争力的性能,验证了其在路面裂缝分割任务中的有效性和稳健性。
本文的其余部分组织如下:第2节回顾了相关文献;第3节介绍了提出的VMFDF-Net和损失函数;第4节描述了实验设置;第5节提供了主要结论。