利用CNN-Mamba混合网络和一致性增强学习,在遥感图像中进行多场景变化检测

《Expert Systems with Applications》:Multi-scenario building change detection in remote sensing images using CNN-Mamba hybrid network and consistency enhancement learning

【字体: 时间:2025年09月25日 来源:Expert Systems with Applications 7.5

编辑推荐:

  多场景建筑变化检测中,针对场景级与数据级伪变化的协同抑制问题,提出C2Mamba模型与一致性增强学习策略。C2Mamba通过CNN-Mamba复合编码器整合局部特征提取与全局建模能力,结合渐进上下文聚合模块与多尺度差异特征增强模块有效区分场景级伪变化。一致性增强学习通过模拟天气与传感器差异进行数据增强,并设计差异聚焦损失函数优化特征对齐。实验在WHU-CD、xBD、WraBCD等数据集验证,F1-score提升1.36%-2.69%,IoU提升2.49%-3.21%,且通过零样本泛化与少样本测试验证泛化能力。

  建筑变化检测(Building Change Detection, BCD)在城市规划、灾害响应和军事监控等领域具有重要意义。随着全球范围内各种突发事件的频发,如雄安新区的快速建设、加利福尼亚州的严重山火以及俄乌冲突的持续影响,BCD技术的实用价值愈发凸显。这些事件往往伴随着建筑物的显著变化,而通过遥感影像进行变化检测,能够为决策者提供及时、客观的数据支持。然而,当前的BCD研究仍然面临诸多挑战,尤其是在处理多场景下的变化检测时。

传统的变化检测方法主要依赖于低分辨率影像和像素级分析,但由于精度不足,容易出现误检。近年来,研究人员逐渐转向基于特征的建模方法,这些方法在结构化场景中表现优异,但在面对复杂变化时,仍然存在对专家经验的过度依赖以及对噪声的敏感性问题。随着遥感影像分辨率的不断提升,建筑物的变化更加清晰可辨,但这也带来了特征选择的难度。因此,深度学习方法逐渐成为变化检测研究的主流方向。

在深度学习方法中,卷积神经网络(Convolutional Neural Networks, CNN)因其在局部特征提取方面的优势,被广泛应用于变化检测任务。然而,CNN的固定感受野限制了其在长距离依赖建模上的能力。相比之下,基于自注意力机制的Vision Transformer(ViT)能够有效建模全局信息,但其计算复杂度较高,且对数据依赖性强,限制了其在实际应用中的扩展性。近年来,基于状态空间模型(State Space Model, SSM)的Vision Mamba(VMamba)为全局建模提供了一种新的思路,其交叉扫描机制和选择性SSM使得模型能够以线性复杂度准确建模全局信息。这一突破为遥感变化检测研究带来了新的可能性,激发了研究人员对VMamba在变化检测中的探索。

然而,尽管深度学习方法在变化检测中取得了显著进展,伪变化(pseudo-changes)仍然是影响模型性能的关键瓶颈。伪变化指的是在变化检测过程中,由于非目标因素引起的误判,如场景中的非建筑物对象(如车辆、道路、植被)发生变化,或由于天气和传感器差异导致的影像差异。这些伪变化往往与真实变化难以区分,从而降低了检测的准确性。目前,大多数方法将伪变化视为单一模式的噪声,采用统一的处理策略,但这种方法无法有效应对场景级和数据级伪变化的不同特性,可能导致语义混淆和特征对齐困难。

因此,本研究提出了一种针对多场景BCD的双伪变化抑制框架。该框架由两个核心部分组成:一种新型的C2Mamba深度学习模型,以及一种一致性增强学习策略(Consistency Enhancement Learning Strategy, CELS)。C2Mamba模型融合了CNN的局部特征提取能力与Mamba的高效全局建模能力,并引入了两个关键模块——渐进式上下文信息聚合模块(Progressive Context Information Aggregation, PCIA)和多尺度差异特征增强模块(Multi-scale Differential Feature Enhancement, MDFE)。这些模块共同作用,使得模型能够在不同地物目标之间准确区分建筑物的变化,从而有效抑制场景级伪变化。

与此同时,CELS策略专注于数据级伪变化的抑制。该策略首先对后时相影像进行数据增强,包括模拟天气变化(如云层、雨天、阴天)和传感器差异。随后,设计了一种差异聚焦的损失函数,使得原始影像对与增强影像对在变化特征上实现准确对齐,从而有效抑制数据级伪变化。这种策略不仅提升了模型的鲁棒性,还增强了其在不同环境下的泛化能力。

为了验证所提方法的有效性,本研究在三个典型数据集上进行了实验评估,包括WHU-CD、xBD和WraBCD数据集,分别对应城市开发、自然灾害和战争场景。实验结果表明,与当前最优的第二方法相比,所提方法在F1分数上分别提升了1.36%、2.69%和1.65%,在IoU(交并比)指标上分别提升了2.49%、3.21%和2.32%。此外,还进行了大量的消融实验,以验证各模块对模型性能的具体贡献。同时,通过零样本泛化和少量样本测试,进一步验证了所提方法的鲁棒性。

在相关工作部分,本文回顾了现有的变化检测方法,包括传统方法、基于深度学习的方法以及伪变化抑制机制。特别地,由于本文方法中引入了小波变换,还对频率域变换在变化检测中的应用进行了探讨。通过总结典型研究的优缺点,为后续提出的方法提供了理论依据和比较基准。

本文所提方法的整体框架如图2所示,主要包括C2Mamba模型和一致性增强学习策略。C2Mamba模型由两个CNN-Mamba复合编码器(CM-CE)和一个CNN解码器(CNN-D)组成。每个CM-CE模块包含一个CNN局部信息编码器(CNN-LIE)和一个Mamba全局建模模块。CNN-LIE负责提取影像的局部特征,而Mamba模块则通过高效的全局建模机制,捕捉影像中的长距离依赖关系。PCIA模块通过渐进式地聚合上下文信息,增强模型对复杂场景中建筑物变化的识别能力。MDFE模块则通过多尺度差异特征增强,进一步优化模型在不同尺度下的变化检测效果。

在数据集部分,本文选取了三个基准数据集和五组零样本泛化影像对,以评估所提方法在多场景下的性能。基准数据集用于模型训练和基准测试,而零样本泛化影像对则用于测试模型在未见过的场景中的泛化能力。这些数据集涵盖了城市开发、自然灾害和战争等多种场景,确保了实验的全面性和代表性。

本文的研究成果有望在多个领域发挥重要作用,包括智慧城市动态监测(如城市扩张跟踪、非法建筑识别)、应急灾害响应(如灾后损害评估、重建过程监测、危险建筑预警)以及国防安全应用(如战区破坏分析)。通过有效抑制场景级和数据级伪变化,所提方法能够显著提升多场景BCD的准确性,为相关领域的研究和应用提供新的思路和技术支持。

综上所述,本文提出的双伪变化抑制框架在多场景BCD任务中展现出良好的性能和应用潜力。C2Mamba模型通过融合CNN和Mamba的优势,提升了模型对复杂场景的适应能力。而一致性增强学习策略则通过模拟数据增强和差异聚焦损失函数,有效抑制了数据级伪变化的影响。实验结果表明,该方法在不同场景下的变化检测任务中均取得了显著的性能提升,为未来BCD研究提供了新的方向和方法。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号