基于图信息瓶颈的遥感图像分割方法(GIB-RSS):提升不规则对象建模与冗余信息抑制能力

【字体: 时间:2025年10月14日 来源:Neurocomputing 6.5

编辑推荐:

  本文提出一种创新的图信息瓶颈框架(GIB-RSS),通过自适应节点与边掩蔽策略和图对比学习,有效解决遥感图像分割中不规则对象建模难题,并显著抑制任务无关冗余信息(如噪声和冗余特征)。该方法在多个公开数据集上超越现有先进模型(如CNN和Transformer),为环境监测与城市变化检测提供更精准的语义分割支持。

  
Highlight
我们通过自适应图掩蔽与信息瓶颈理论的融合,显著提升了遥感分割中对不规则对象的表征能力,并在多个数据集中验证了方法的优越性。
Approach
本节阐述如何将图像构建为图结构数据,并引入结合信息瓶颈的图对比学习架构(GCL),以学习图像的全局上下文位置信息。
Experiments
本节在遥感图像分割任务上验证所提GIB-RSS方法的有效性。
Results and discussion
为证明GIB-RSS的优越性,我们在四个基准数据集(UAVid、Vaihingen、LoveDA和Potsdam)上进行实验。结果如表2至表5所示,GIB-RSS显著优于现有先进对比算法。具体而言,在UAViD数据集上(表2),GIB-RSS的mIoU值达到70.6%,较其他模型提升3%至11%。在其他类别中的分割精度也一致领先。
Sensitivity analysis of α
图4展示了参数α对UAVid、Vaihingen、Potsdam和LoveDA数据集分割性能的影响。结果表明,模型性能随α从0.1增加而整体提升,在0.5–0.8范围内达到最高精度,而当α过大时略有下降。在UAVid和Potsdam上,mIoU在α=0.7附近达到峰值,分别约为72%和90%,而Vaihingen在α=0.5附近取得最佳性能,mIoU约87%。
Complexity and inference speed analysis
为进一步评估GIB-RSS的实际性与效率,我们在LoveDA测试集上对比了其计算复杂度和推理速度与若干代表性基线方法。如表6所示,对比包括模型参数量(记为“Complexity (M)”)和以每秒帧数(FPS)衡量的推理速度。所有测量均在1024×1024输入分辨率下使用单块NVIDIA GTX 3090 GPU进行。我们的GIB-RSS实现了竞争性的复杂度与速度平衡。
Visualization of segmentation results
如图5、图6和图7所示,我们直观展示了模型的分割结果。可视化结果证明了所设计GIB-RSS在处理挑战性不规则对象时的有效性。具体地,在图5中,可见GIB-RSS比其它SOTA模型能更精确地分割树木和建筑物,错误分割案例相对较少。其它模型易将低植被类别误分类为背景类别。
Ablation study
我们在四个分割数据集上对GIB-RSS进行消融研究,以说明所采用模块的有效性。
Potential applications in low-shot and zero-shot settings
尽管所提GIB-RSS框架主要针对全监督遥感分割任务设计,其架构特性天然适用于低样本或零样本学习等数据稀缺环境。我们简要概述了GIB-RSS在这些挑战性设置中应用的潜在方向。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号