一种基于“幻影曼巴”(Vision Mamba)技术的增强型网络,该网络结合了频率方向特征融合技术,用于路面裂缝的分割

《Engineering Applications of Artificial Intelligence》:A vision mamba-enhanced network with frequency-directional feature fusion for pavement crack segmentation

【字体: 时间:2026年02月18日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  路面裂缝智能检测方法研究综述与系统实现方案

  
李曦|王宇琦|周强|詹建辉|左登|陈伟超
中国漳州闽南师范大学计算机科学学院,363000

摘要

随着智能交通和基础设施数字化的快速发展,路面裂缝检测已成为连接土木工程和计算机视觉的研究热点。它在提高道路安全性和优化维护操作方面发挥着重要作用。然而,裂缝的不规则形态及其对背景干扰的敏感性给实现准确和稳健的自动检测带来了重大挑战。为有效解决这些问题,本文提出了一种基于Vision Mamba的增强网络——VMFDF-Net,该网络结合了频率-方向特征融合技术,以实现高效的裂缝分割。该网络集成了全局建模和局部特征提取能力,将Vision Mamba的机制与卷积神经网络(CNN)相结合。通过引入多频率、多方向特征建模和自适应门控融合模块,增强了裂缝的表征能力。所提出的Vision Mamba Convolutional(VMambaConv)模块将局部纹理增强与长距离依赖性建模相结合,以提高裂缝特征提取的效果。在瓶颈层,Wavelet and Directional-aware Feature Cascade(WDcascade)模块通过门控机制自适应地融合多源特征,从而在复杂背景下更好地表征各种裂缝模式。在四个公开可用的裂缝数据集CRACK500、DeepCrack、CFD和EdmCrack600上评估了该模型的有效性,使用了六项评估指标进行公平客观的评估。实验结果表明,该模型通常能够取得优异的性能。我们的代码在GitHub上是开源的:https://github.com/Acruelsummer/VMFDF-Net/tree/main

引言

随着智能交通和基础设施数字化的不断推进,路面裂缝检测已成为土木工程和计算机视觉交叉领域的一个有前景的研究课题。开发此类检测方法对于提高道路安全性、延长使用寿命和降低维护成本具有重要意义。
然而,与结构裂缝相比,路面裂缝通常更细且形态更加不规则。它们还受到环境光照、噪声和水渍的严重影响(Park和Kim,2015)。此外,裂缝区域与背景之间的对比度低进一步增加了检测难度。现有的深度学习模型在面对复杂背景和极细裂缝时仍存在稳定性不足、边缘模糊或漏检的问题。
最近基于深度学习的方法在裂缝分割方面取得了显著进展。早期的方法采用了全卷积网络(FCN)(Dai等人,2016)和U-Net(Ronneberger等人,2015),实现了裂缝图像的高精度分割。进一步的发展引入了多尺度特征提取和注意力机制,以改善细裂缝结构的表征。例如,DeepCrack(Zou等人,2018)通过多尺度输出增强了分割效果。Transformer(Vaswani等人,2017)在全局依赖性建模方面表现出色,进一步推动了裂缝分割技术的发展。代表性的例子包括CrackFormer(Liu等人,2021),以及将Transformer模块集成到U形网络中的混合架构,如SwinUNet(Cao等人,2022)和TransUNet(Chen等人,2021)。
最近,以Mamba为代表的状态空间模型(SSM)成为一种有前景的方法。Mamba(Gu和Dao,2023)通过选择性机制和硬件优化提高了建模效率,在音频和文本建模等数据密集型任务中表现出色。计算复杂度降低到线性时间,同时保持了捕捉长距离依赖性的能力。Vision Mamba(VMamba)(Liu等人,2024)通过引入Cross Scan Module(CSM)将SSM的应用扩展到视觉任务中。特别是,图像被转换为序列,这种方法在裂缝分割中的有效性已得到初步验证(Han等人,2024;Liu等人,2025;Qi等人,2024)。
然而,当前的VMamba架构主要针对全局特征建模设计,其模块优化了长距离依赖性建模,导致在捕捉细粒度局部结构(如裂缝边缘和形态变化)方面的性能有限。因此,对于小型、连续和细长的裂缝模式的准确建模仍然不足。
为有效解决这些限制,本文基于DeepCrack框架开发了一种新的路面裂缝分割网络。编码器采用了一种混合VMambaConv模块,结合了Vision Mamba和卷积操作来共同建模全局依赖性和局部空间细节。瓶颈层引入了WDcascade模块,通过多频率、方向特征学习和自适应门控融合来增强非结构化裂缝的建模。解码器利用基于CNN的上采样策略,合并来自不同编码器-解码器阶段的特征,并结合多尺度深度监督来提高分割性能。
我们方法的主要贡献可以总结如下:
1. 提出了一种用于路面裂缝分割的VMFDF-Net架构,该架构结合了全局上下文建模和局部细节表征。通过将基于Vision Mamba的全局建模与卷积局部特征提取相结合,构建了一个混合编码器,并在瓶颈层采用了多频率方向建模策略,以综合考虑全局和局部裂缝特征。
2. 设计了VMambaConv模块来增强空间特征表征。为了弥补Vision Mamba在局部细节建模方面的局限性,采用了由深度卷积、状态空间建模和残差连接组成的序列结构,实现了局部纹理和长距离依赖性的联合建模。
3. 引入了基于多频率方向建模的WDcascade瓶颈模块。将小波卷积的多频率分析能力与动态蛇形卷积的方向感知能力相结合,并使用自适应门控机制实现了不同频率和方向特征的加权融合。
4. 在多个公共裂缝分割数据集上进行了广泛实验。结果表明,所提出的方法在多个评估指标上均取得了有竞争力的性能,验证了其在路面裂缝分割任务中的有效性和稳健性。
本文的其余部分组织如下:第2节回顾了相关文献;第3节介绍了提出的VMFDF-Net和损失函数;第4节描述了实验设置;第5节提供了主要结论。

节选

道路表面裂缝的工程特性分析

根据其形态、成因和分布模式,道路表面裂缝主要可以分为以下四类(Mackiewicz,2018):
纵向裂缝沿着道路中心线发展,通常表现为连续或不连续的细线。它们通常由纵向接缝的施工质量差、热收缩或不均匀沉降引起。在图像中,它们表现为宽度相对均匀的细长线性结构。

方法论

本节概述了网络的总体架构。随后描述了瓶颈处的VMambaConv模块和WDcascade模块。最后介绍了本工作中使用的损失函数。

结果与讨论

首先描述了所提出的VMFDF-Net的实现细节,然后介绍了公共裂缝数据集。接着介绍了比较方法和评估指标。最后提供了实验结果并进行了分析。

结论

本文提出了VMFDF-Net,这是一种利用Vision Mamba和CNN混合架构的道路裂缝分割新网络。其主要贡献在于两个关键设计,这两个设计解决了裂缝的形态多样性问题。首先,VMambaConv模块有效地将全局上下文与局部细节融合在一起,确保了长连续裂缝的完整性,同时保留了复杂疲劳裂缝的细微纹理。其次,WDcascade模块通过……

CRediT作者贡献声明

李曦:撰写 – 审稿与编辑,撰写 – 原稿撰写,验证,方法论研究,概念化。王宇琦:撰写 – 审稿与编辑,监督,项目管理,资金获取。周强:撰写 – 审稿与编辑,资源协调,形式分析。詹建辉:撰写 – 审稿与编辑,研究调查。左登:撰写 – 审稿与编辑。陈伟超:研究调查。

利益冲突声明

作者声明他们没有已知的可能会影响本文工作的竞争性财务利益或个人关系。

致谢

我们感谢Binju Wang和Hong Zhao在修改和改进手稿语言方面提供的宝贵帮助。本研究部分得到了国家自然科学基金(资助编号:62376114)和中国博士后科学基金(资助编号:2025M771591)的支持。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号