动态权重与跨时相建模网络:解决高分辨率遥感建筑变化检测中的辐射差异与几何形变挑战
《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》:Dynamic Weights and Cross-Temporal Modeling Network for Building Change Detection
【字体:
大
中
小
】
时间:2025年12月16日
来源:IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing 5.4
编辑推荐:
本文针对高分辨率遥感图像建筑变化检测(BCD)中因辐射差异和几何形变导致的误检难题,提出了一种动态权重与跨时相建模网络(DWCTNet)。该研究通过设计动态权重模块(DWM)实现辐射不变特征表征,并利用跨时相交互模块(CTIM)增强对建筑位移形变的适应性。在WHU-CD、GZ-CD和LEVIR-CD数据集上的实验表明,DWCTNet的F1分数分别达到93.66%、88.64%和91.35%,IoU指标达到88.07%、79.61%和83.39%,显著优于现有方法,为城市动态感知提供了可靠技术支撑。
随着高分辨率遥感卫星的飞速发展,地球观测能力获得了前所未有的提升。建筑作为城市的核心要素,其变化信息对城市规划、土地利用和灾害评估等关键任务具有重要影响。然而,如何从海量的遥感数据中智能解读出结构化的建筑变化信息,构建具备实时或准实时处理能力的精确建筑变化检测(BCD)技术体系,已成为突破城市动态感知瓶颈的关键技术需求。
尽管需求迫切,但高分辨率遥感图像中的建筑变化检测仍面临诸多严峻挑战。复杂的环境干扰首当其冲——植被覆盖、阴影投射以及临时地物等要素导致误检率居高不下。建筑目标自身的尺度差异也带来巨大困扰,从独立住宅到大型建筑群,目标尺度可能跨越数个数量级。此外,时间维度上的干扰因素同样不容忽视:季节变化、光照条件以及拍摄角度差异都会引入虚假的变化信息。而最考验技术精度的当属边界精细度要求,相邻建筑的间距往往基于尺度需求,这要求检测算法必须具备高精度、清晰的边界定位能力,以避免出现断裂或模糊的边缘。
早期变化检测方法如图像差异法、面向对象分析以及传统机器学习等,通常依赖于人工设计的特征或浅层模型。这些方法在模拟遥感图像复杂非线性特征方面存在天然局限,难以处理高分辨率图像中丰富的细节上下文信息。近年来,深度学习通过数据驱动的特征学习推动了变化检测性能的实质性进步。以U-Net及其变体为代表的编码器-解码器架构通过跳跃连接整合浅层细节与深层语义,已成为主流范式。然而,这些方法依赖于固定的特征融合规则,难以适应建筑尺度分布的高度异质性。随后出现的Transformer模型为全局上下文建模提供了新思路,但其计算复杂度问题依然存在。
现有方法在应对BCD核心挑战时仍存在明显不足。在混合架构中,CNN的局部性和Transformer的全局性往往只在网络后期才进行整合,导致双时相特征在初始提取阶段交互不足,产生"时相间语义错位"问题。这种错位进一步降低了多尺度特征融合效果,使得固定规则的金字塔结构(如FPN)难以应对尺度异质性,同时由于CNN的局部约束削弱了全局上下文的指导作用。最终的性能瓶颈源于无法有效处理"辐射差异"和"几何形变"的耦合干扰。
针对这些挑战,研究人员在《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》上发表了题为"Dynamic Weights and Cross-Temporal Modeling Network for Building Change Detection"的研究论文,提出了一种基于动态权重和跨时相建模的建筑变化检测网络(DWCTNet)。
该研究采用了几个关键技术方法:首先利用Swin Transformer V2构建双分支权重共享编码器提取多尺度特征;然后设计动态权重模块(DWM),通过跨时相联合注意力和多尺度空间注意力机制实现特征动态优化;接着提出跨时相交互模块(CTIM),结合双向交叉注意力和可变形卷积网络增强几何形变适应性;最后采用分层解码器逐步融合浅层细节特征和深层语义特征生成高分辨率变化图。实验使用了WHU-CD、GZ-CD和LEVIR-CD三个公开数据集,这些数据集分别来自新西兰基督城、中国广州郊区和美国德克萨斯州,包含不同季节、光照条件下的建筑变化样本。
基于特征解耦的理论建模,研究人员设计了DWM的三个渐进变体进行验证。单独使用跨时相联合注意力(CA)在三个数据集上平均提升F1分数1.3%,验证了其通过联合特征学习抑制辐射差异的能力。单独使用多尺度空间注意力(SA)平均提升1%,反映了其对多尺度变化区域的聚焦效果。完整DWM的平均提升达到3.1%,显著超过CA和SA独立增益之和,证实了理论模型的正确性:CA通过抑制辐射差异(NA, NB)为SA提供"净化"的特征输入,而SA在此基础上更准确地捕捉真实变化信号(Δ),二者协同实现了理论预测的叠加效应。
CTIM采用"语义对齐后形变适应"的深度交互范式。单独使用双向交叉注意力(XA)通过语义对齐显著提升召回率,在三个数据集上平均提升3.6%。单独使用可变形卷积(DCN)主要提升边界精度,平均交并比(IoU)提升1.8%。完整CTIM在所有指标上达到最优,在几何形变明显的LEVIR-CD数据集上表现尤为突出。特征热力图可视化分析显示,CTIM输出的特征响应与新增建筑结构实现精确空间对齐,对拆除建筑遗址产生中强度响应特征,且响应区域与T1时相建筑轮廓高度匹配,证明了该模块对建筑拆除事件的捕获能力和复杂场景下的鲁棒性。
系统权重配置实验表明,当二元交叉熵损失(BCE)和Dice损失权重比为1:1时,模型在所有评估指标上达到最优。具体而言,该平衡配置在F1分数上分别比其他配置提升2.91%和1.12%。高Dice权重(0.75)可提升小目标召回率但导致边界模糊,IoU最低至83.07%;高BCE权重(0.75)增强类别判别力但对小变化不敏感,导致漏检增加。训练收敛曲线显示,所有数据集上训练损失均稳定快速下降,验证集F1分数同步提升,最终收敛到稳定平台,无过拟合迹象。
在WHU-CD数据集上的效率分析表明,DWCTNet的计算复杂度(FLOPs)仅为12.40G,比最接近的竞争者CFNet(13.97G)降低11.2%,参数数量(33.11M)处于中等水平。在保持高精度的同时,F1分数达到93.66%,比次优方法CFNet提升0.87%,IoU达到88.07%,比DMFANet提升0.6%。这种精度与效率的优异平衡使得DWCTNet在资源受限场景下具有实用价值。
边界IoU指标定量评估显示,DWCTNet在WHU-CD数据集上达到65.84%,显著优于其他对比方法。这表明CTIM模块中的语义对齐特征与可变形卷积的局部适应性共同增强了解码器生成具有更佳几何精度和清晰边界的变化图能力。
研究的讨论部分还指出了方法的局限性,包括对大量标注数据的依赖、在弱标注场景下性能欠佳、可解释性不足以及无法区分具体变化类型等问题。这些局限性为未来研究指明了方向:开发自监督表示学习以减少数据依赖、探索神经符号计算以增强可解释性、设计轻量级多模态融合架构以提高适应性。
该研究的结论部分强调,DWCTNet通过集成动态特征优化机制与跨时相建模方法,构建了多阶段特征处理和时空关系建模框架,实现了复杂场景下建筑变化的精确感知和鲁棒检测。方法在三个基准数据集上的系统性实验验证了其有效性,不仅提供了高性能检测模型,其技术特性还赋予其实用应用潜力。在土地监管和城市规划领域,方法的高精度能够有效识别未报建的新建建筑,辅助违建执法;清晰的边界输出可直接服务于建筑足迹变化的统计分析,为城市扩张研究提供数据支撑。在商业地图数据生产流程中,方法能够实现大规模、周期性的建筑变化信息自动提取,推动导航地图和智慧城市底图的快速增量更新,降低传统人工解译的高成本和时间延迟。
这项研究通过创新性的动态权重学习和跨时相特征交互机制,为解决高分辨率遥感建筑变化检测中的辐射差异和几何形变耦合干扰问题提供了有效方案,为相关领域的技术发展奠定了重要基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号