基于Segment Anything模型多级特征适配的高分辨率遥感土地利用/覆被分类方法

【字体: 时间:2025年06月13日 来源:International Journal of Applied Earth Observation and Geoinformation 7.6

编辑推荐:

  为解决高分辨率遥感影像(HRRS)土地利用/覆被(LULC)分类中样本不足和模型泛化能力弱的问题,研究人员提出多级特征适配的Segment Anything模型(MLFA-SAM)。该模型通过域分布偏移适配(DDSA)、深度低秩适配(DLRA)和语义聚焦适配(SFA)三级调优策略,在HRLC和Potsdam数据集上分别达到68.43%和86.97%的mIoU,显著提升跨场景分类性能,为大规模LULC制图提供新范式。

  

随着高分卫星技术的快速发展,高分辨率遥感影像(HRRS)已成为土地利用/覆被(LULC)监测的重要数据源。然而传统深度学习方法面临两大瓶颈:一是受限于标注样本稀缺性,二是自然图像预训练模型直接迁移至遥感场景时存在显著的域分布偏移(Domain Shift)。这种"水土不服"现象导致模型在跨区域、跨时相应用中性能骤降。更棘手的是,现有方法大多将多光谱遥感数据简化为RGB三通道处理,忽视近红外(Nir)等关键波段信息,造成植被、水体等地物特征提取不完整。

针对这些挑战,中国科学院空天信息创新研究院的研究团队创新性地将计算机视觉领域的Segment Anything模型(SAM)引入遥感解译领域,提出多级特征适配的MLFA-SAM框架。这项发表于《International Journal of Applied Earth Observation and Geoinformation》的研究,通过三级渐进式适配策略成功突破基础模型在遥感场景的应用壁垒。

技术方法上,研究团队首先构建包含1283张0.65-2米分辨率影像的HRLC数据集,涵盖7类典型地物。核心创新体现在:1) 设计域分布偏移适配模块(DDSA),采用深度可分离卷积分解空间-光谱特征;2) 开发深度低秩适配策略(DLRA),在LoRA基础上引入局部细节卷积分支;3) 改造SAM的掩码解码器,新增语义头实现多类输出。训练采用AdamW优化器和混合损失函数,在Tesla V100显卡上完成模型调优。

研究结果部分,三级标题下的关键发现如下:

"Domain distribution shift adaptation"部分验证了DDSA模块的有效性。消融实验显示,移除该模块会使mIoU下降7.6%,证明其能有效缓解自然图像与遥感影像间的特征分布差异。深度可分离卷积的参数量仅传统卷积的1/9,却能在HRLC数据集上使农田分类精度提升5.85%。

"Depthwise Low-Rank adaptation"章节揭示了DLRA的优越性。相比原始LoRA,添加3×3和9×9细节卷积分支后,模型在Potsdam数据集上的低植被分类IoU提高2.65%。可视化结果显示,该方法能更好保持道路、建筑物边缘的连续性。

"Semantic focused adaptation"环节证实了多类掩码解码的必要性。新增的语义头使HRLC数据集总体精度(OA)达到87.91%,其中近红外波段的引入使植被和水体分类精度提升尤为显著,森林与农田的IoU差值从3.72%缩小至1.01%。

在"Generalization evaluation"部分,模型展现出卓越的跨场景适应能力。在LoveDA城乡场景迁移测试中,其mIoU(49.37%)远超对比方法;在安徽四地市的实地验证中,不同季相、传感器影像的分类结果均保持空间一致性,仅密集建成区出现局部混淆。

结论部分指出,MLFA-SAM通过"特征适配-参数调优-语义增强"的协同优化,首次实现SAM基础模型在遥感LULC分类中的有效迁移。该方法在保持SAM原有107M参数冻结的前提下,仅训练15.59M适配参数,就在多项指标上超越DcSwin等专用模型。讨论中作者坦言,当前对小目标(如道路)的识别仍存不足,未来拟通过引入注意力机制和多尺度特征融合进一步优化。这项研究不仅为遥感智能解译提供了新思路,也为其他领域的基础模型迁移应用树立了技术范式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号