MDFANet:面向遥感变化检测的多维特征对齐自监督预训练框架

《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》:MDFANet: Multi-Dimensional Feature Alignment Network for Self-Supervised Pre-Training in Remote Sensing Change Detection

【字体: 时间:2025年12月16日 来源:IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing 5.4

编辑推荐:

  本文针对遥感变化检测中多层级特征利用不足和频域细节挖掘欠缺的问题,提出了一种名为MDFANet的多维特征对齐自监督预训练框架。该研究通过引入分层解耦与多维特征对齐(HDMFA)机制以及浅层频域特征对齐(SFFA)分支,显著提升了模型在复杂场景下对变化目标的识别能力和边界定位精度。在LEVIR-CD、SYSU-CD和EGY-BCD数据集上的实验表明,MDFANet的F1分数比现有最优方法提升1.7-2.3%,为高分辨率遥感影像变化检测提供了新的技术路径。

  
随着全球城市化进程的加速,如何精准捕捉地表变化已成为遥感技术领域的核心挑战。传统变化检测方法往往受限于标注数据稀缺的瓶颈,而现有自监督学习方法在多层次特征利用和边界细节捕捉方面仍存在明显不足。特别是在多目标尺度差异显著、季节光照变化复杂的场景中,模型往往出现变化区域断裂、小目标漏检、边界模糊等问题,严重制约了高精度变化检测的应用潜力。
针对这一挑战,中国三峡大学研究团队在《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》上发表了一项创新研究,提出名为MDFANet的多维特征对齐自监督预训练框架。该研究通过设计分层解耦与多维特征对齐机制,实现了深层语义特征与浅层细节特征的协同优化。特别值得关注的是,研究团队创新性地引入频域特征对齐分支,有效弥补了空间域边缘特征表征的不足,使模型在复杂边界检测任务中表现出显著优势。
关键技术方法主要包括:1)基于CycleGAN的双向域投影系统,通过生成式对抗网络消除时序影像的风格差异;2)分层解耦架构,分别从ResNet的Conv3x和Conv5x层提取浅层空间特征和深层语义特征;3)多维特征对齐头,包含空间分支、频域分支和通道分支,分别采用不同的投影器和预测器进行特征对齐;4)频域变换模块,通过傅里叶变换提取边缘纹理的频域特征。实验采用LEVIR-CD(包含637对谷歌地球影像)、SYSU-CD(2万对香港地区影像)和EGY-BCD(埃及四大区域6091对影像)三个公开数据集进行验证。
模型架构设计
研究团队构建的MDFANet包含三个核心组件:域提取模块、特征提取模块和多维特征对齐头。其中域提取模块通过双向风格迁移生成器,将双时相影像投影到统一特征空间,有效抑制光照、季节变化引起的伪变化。特征提取模块采用权重共享的ResNet骨干网络,分别从浅层和深层提取特征集。最具创新性的多维特征对齐头为浅层特征配置空间和频域分支,为深层特征配置空间和通道分支,通过负余弦相似度损失实现跨时序特征对齐。
频域特征增强机制
针对传统方法对边缘特征捕捉不足的缺陷,研究团队设计了专门的频域特征对齐分支。该分支通过傅里叶变换将空间特征转换至频域,保留实部成分进行非线性映射,最终生成2048维特征向量。如图4所示,频域投影器和预测器采用三层线性投影结构,通过批量归一化和ReLU激活函数强化高频成分提取能力,显著提升了对建筑物轮廓等细节特征的感知灵敏度。
多维度对比学习
研究在四个主流变化检测基线模型(FC_EF、FC_Siam_conc、SNUNet和USSFCNet)上验证预训练效果。损失函数设计包含空间对齐损失Spa_S、频域对齐损失Fre_S、深层空间对齐损失Spa_D和通道对齐损失Cha_D,通过加权求和实现多维度特征约束。为避免表征坍塌,训练过程中采用梯度停止策略,确保对比学习的稳定性。
实验验证结果
在LEVIR-CD数据集上,MDFANet在FC_EF基线上实现F1分数88.92%,较无预训练基线提升4.00%;在SYSU-CD数据集上,USSFCNet基线获得80.73%的F1分数,显著优于对比方法。特别是在EGY-BCD这类具有复杂沙漠背景的数据集上,模型在建筑物材质与沙地颜色相近的挑战性场景中仍保持77.05%的F1分数,证明其强大的特征区分能力。
泛化能力分析
跨数据集测试表明,当模型在LEVIR-CD训练后直接应用于CDD数据集时,MDFANet仍保持71.96%的F1分数,远超其他预训练方法。消融实验进一步证实,分层解耦与多维特征对齐机制(HDMFA)贡献最大性能提升,单独启用可使F1分数提高0.61-1.34%;而浅层频域对齐分支(SFFA)尤其在边界检测任务中发挥关键作用。
效率与实用性平衡
计算复杂度分析显示,MDFANet需14.89 GFLOPs计算量和10.1GB显存,虽略高于MoCo v2等轻量方法,但相较于其带来的精度提升,这种开销具有显著性价比。研究团队同时探讨了模型轻量化路径,指出可通过结构剪枝和频谱卷积优化进一步压缩计算成本。
本研究通过创新性的多维特征对齐机制,成功解决了遥感变化检测中的多尺度适应和边界精准定位难题。MDFANet框架展现出的强泛化能力,为少样本场景下的应用提供了可行方案。尽管在极细小变化检测和多模态数据融合方面仍有提升空间,但其所建立的分层解耦范式无疑为后续研究指明了方向。随着未来与脉冲神经网络等新兴技术的结合,这类自监督预训练框架有望在生态监测、灾害评估等实时遥感应用中发挥更大价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号