基于改进U-Net模型的多尺度信息与注意力机制在埃及旱季地表水遥感制图中的应用研究

【字体: 时间:2025年06月21日 来源:International Journal of Applied Earth Observation and Geoinformation 7.6

编辑推荐:

  针对埃及旱季地表水体光谱差异大、形态复杂和小型水体检测困难等问题,研究人员提出融合多尺度信息和注意力机制的改进U-Net模型GLF-MFUNet。该模型通过双路径编码器(VGG卷积块与Manhattan Vision Transformer块)提取局部-全局特征,结合空间先验卷积注意力模块(SPCAI)实现特征融合,在Sentinel-2影像上取得IoU 94.26%、F1-score 97.05%的精度,显著提升复杂环境下水体边界完整性和小型水体识别能力,为干旱区水资源管理提供新方法。

  

在气候变化加剧和人口快速增长的背景下,埃及作为非洲典型的干旱国家,正面临日益严峻的水资源短缺问题。这个国土面积超过100万平方公里的国家,约95%的区域被沙漠覆盖,仅有尼罗河沿岸4%的土地承载着全国99%的人口。特别是在旱季,埃及的地表水体呈现出显著的光谱差异、复杂的形态变化以及大量细小的支流,这些特征给传统遥感监测方法带来巨大挑战。现有水体检测方法在应对高空间-光谱变异性的干旱区水体时,往往难以准确识别小型水体和复杂背景下的水体边界,导致监测结果出现碎片化或边界模糊等问题。

针对这一科学难题,国内研究人员在《International Journal of Applied Earth Observation and Geoinformation》发表论文,提出了一种名为GLF-MFUNet的创新模型。该研究通过整合多尺度信息与注意力机制,构建了基于改进U-Net架构的深度学习模型,显著提升了埃及旱季地表水遥感制图的精度。研究团队采用2023年7月获取的Sentinel-2多光谱影像(重点选用10米分辨率的红、近红外和中红外波段),构建了包含11,177个256×256像素样本的数据集,通过双路径编码器、空间先验卷积注意力模块(SPCAI)和U-Net++解码器的协同设计,实现了局部特征与全局上下文信息的高效融合。

关键技术方法包括:1) 采用VGG卷积块与Manhattan Vision Transformer(MVT)块构建双路径编码器,其中MVT块创新性地引入基于曼哈顿距离的二维双向空间衰减矩阵(MaSA);2) 设计SPCAI模块整合空间和通道注意力机制,通过多尺度深度卷积实现动态权重分配;3) 采用U-Net++解码器进行特征上采样和细节恢复;4) 结合Focal Loss和Dice Loss的混合损失函数优化模型训练。

研究结果显示:

  1. 模型架构验证:GLF-MFUNet在测试集上达到IoU 94.26%、F1-score 97.05%、精度95.94%的优异性能,较传统U-Net提升2.78%的IoU,较DeepLabV3+提升3.56%的IoU。消融实验证实,单独添加MVT块可使IoU提高1.04%,而结合SPCAI模块后进一步提升1.36%。

  2. 复杂场景适应性:在小型水体(如沙漠绿洲)、狭长河道和富营养化水体边界等挑战性场景中,该模型展现出显著优势。可视化对比显示,传统方法如SegFormer在小型水体提取中存在明显遗漏,DeepLabV3+则出现边界模糊,而GLF-MFUNet能保持完整的空间连续性。

  3. 多尺度特征融合:通过SPCAI模块实现的通道-空间注意力机制,有效解决了光谱相似区域(如农田与水体的混淆)的误分类问题。ROC曲线分析表明,在六类典型测试场景中,该模型的AUC值均优于对比方法。

  4. 计算效率平衡:在NVIDIA GeForce GTX 1080硬件环境下,模型推理时间为34.19秒,在精度与效率间取得良好平衡,适用于大范围水体制图。

这项研究的创新性主要体现在三个方面:首先,提出的MaSA机制通过曼哈顿距离度量改进了传统自注意力计算,在保持空间先验的同时将复杂度降至线性;其次,SPCAI模块首创性地将空间衰减矩阵与通道注意力结合,使注意力权重能依据特征分布动态调整;最后,双路径编码器设计实现了卷积神经网络(CNN)与视觉Transformer(ViT)的优势互补。

研究结论指出,GLF-MFUNet模型为干旱区地表水监测提供了新的技术解决方案,其卓越的性能表现在三个方面:1) 通过多尺度特征融合有效捕捉了从大型湖泊到灌溉渠道等不同规模的水体特征;2) 注意力机制显著提升了复杂背景下的边界识别精度;3) 模型架构兼顾全局上下文理解与局部细节保留。这些突破使得该技术有望应用于全球干旱区水资源管理,特别是在气候变化导致的水体形态快速变化的监测场景中具有重要应用价值。未来研究可进一步探索多时相数据融合和跨传感器应用,以增强模型在云雾覆盖等复杂条件下的鲁棒性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号