DAS-Unet:用于从高分辨率遥感图像中提取建筑物信息的算法

《Geocarto International》:DAS-Unet for building extraction from high-resolution remote sensing images

【字体: 时间:2025年12月21日 来源:Geocarto International 3.5

编辑推荐:

  本文提出DAS-Unet模型,通过增强U-Net的背 bone(采用ResNet50)、优化多方向池化模块和引入A2双注意力机制,有效提升高分辨率遥感影像中建筑物提取的精度与边界清晰度,在Massachusetts和昆山城市数据集上验证了其优于传统模型的性能。

  
在遥感影像处理领域,建筑提取技术因其对城市规划、灾害评估和资源管理的重要支撑作用而备受关注。传统方法依赖人工特征设计,存在特征提取不足和泛化能力弱的问题。随着深度学习技术的发展,基于卷积神经网络(CNN)的模型逐渐成为该领域的主流解决方案。U-Net因其对称编码-解码结构在医学图像分割中表现优异,但其在处理复杂遥感场景时仍面临边界模糊、多尺度特征融合不足等挑战。

该研究提出DAS-Unet模型,通过三阶段优化显著提升建筑提取精度。首先,改进的U-Net主干网络采用ResNet50架构,结合多尺度膨胀卷积,在保持计算效率的同时扩展感受野。其次,创新性设计的双注意力机制(A2模块)通过分阶段特征聚合与分配,实现全局上下文与局部细节的协同优化。最后,优化的多方向池化模块通过水平和垂直方向组合池化操作,有效捕捉长条形建筑物的空间特征。

实验验证部分,模型在Massachusetts和Kunshan两大数据集上均展现显著优势。在Massachusetts数据集中,DAS-Unet的F1分数达到91.45%,较传统U-Net提升3.17%,在复杂边界场景下mIoU提升达8.74%。特别在Kunshan城市数据集(2.15米分辨率)测试中,模型在密集建筑群(图5b)和微小建筑(图5d)场景下均保持98%以上的像素级准确率。消融实验显示,优化后的池化模块使F1分数提升1.65%,而A2注意力机制贡献了2.78%的性能增益。

模型创新点体现在三个维度:1)网络架构层面,通过ResNet50预训练特征和膨胀卷积结合,解决传统U-Net在浅层网络特征表达能力不足的问题;2)注意力机制设计,采用双向注意力流(特征聚合与再分配),相比单侧注意力机制提升特征利用率达37%;3)多尺度处理策略,在编码端引入1×1卷积下采样,解码端通过残差连接实现跨尺度特征融合,有效处理200米至500米不同尺度的建筑群。

在模型应用方面,测试案例显示DAS-Unet对玻璃幕墙建筑(图4c)和地下车库(图5c)等复杂结构表现出色。通过引入方向性池化(水平和垂直方向分别处理),模型能准确识别建筑物的延伸方向和立体结构。A2模块的双向注意力机制在处理相邻建筑边界时,将误分割率降低至2.3%以下,较传统U-Net提升41%。

技术对比方面,与DeepLabV3+相比,DAS-Unet在边界模糊场景(如贴砖外墙)的mIoU提升12.7%,得益于多方向池化模块对纹理特征的增强提取。相较于HRNet等轻量化模型,DAS-Unet在保持0.55%像素级误差的同时,计算效率提升23%,验证了其在高分辨率影像(>500万像素)处理中的工程适用性。

该研究为遥感图像处理提供了新范式:首先建立ResNet50+膨胀卷积的骨干网络,通过通道注意力机制强化关键特征,最后利用空间注意力引导像素级分类。这种方法在保持模型复杂度可控(参数量约1.2亿,训练成本约15小时)的同时,实现了边界识别精度(平均边界模糊度<0.8像素)和全局一致性(跨尺度特征融合误差<3%)的双重突破。

实际应用测试表明,在苏州工业园区(2.15米分辨率影像)的实地应用中,模型对工业厂房(图5b)和高层住宅(图5a)的识别准确率达到96.2%,较现有最优模型提升5.8个百分点。在灾害应急场景(图4d)测试中,模型在浓烟干扰下的建筑提取完整度达到89.7%,较传统方法提升17.3%。这些结果验证了模型在复杂真实场景中的鲁棒性和实用性。

未来优化方向包括:1)引入动态自适应卷积层,根据输入分辨率自动调整特征提取策略;2)开发轻量化版本以适应无人机航拍数据的实时处理需求;3)拓展至多建筑类型识别,如识别不同材质(混凝土、钢结构)和功能(住宅、商业)建筑。这些改进有望将模型在百万像素级影像上的推理速度提升至0.8秒/张,为智慧城市监测提供高效解决方案。

该研究在计算机视觉领域的重要贡献在于:首次将ResNet50骨干网络与多方向池化模块结合,突破传统U-Net在建筑提取中的边界模糊瓶颈;提出的A2注意力机制在保持计算效率(参数量<5%)的同时,将全局上下文感知能力提升至现有模型的1.5倍。这些创新为遥感图像处理领域提供了新的技术路线,特别是在高分辨率影像(>500万像素)处理中展现出显著优势。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号