
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于跨层信息可分离性的非洲水体特征解耦Transformer分割方法
【字体: 大 中 小 】 时间:2025年07月25日 来源:International Journal of Applied Earth Observation and Geoinformation 7.6
编辑推荐:
非洲水资源短缺问题严重,但现有水体分割方法面临数据缺乏、小水体识别难等挑战。北京航空航天大学团队构建了覆盖全非洲的AWS16K数据集,并提出基于跨层信息可分离性的特征解耦Transformer(FDTran),通过非对称跨层注意力机制实现高低层特征交互,在AWS16K和LandCover.ai等数据集上达到SOTA性能。该研究为非洲水资源监测提供了新工具,代码数据集已开源。
非洲大陆40%的土地处于干旱或半干旱状态,水资源短缺问题日益严峻。传统的水资源监测方法效率低下,而基于深度学习的遥感水体分割技术为这一问题提供了新的解决方案。然而,非洲水体分割面临三大挑战:缺乏高质量标注数据、存在大量细小水体、以及水体与背景高度相似的特征。这些难题导致现有语义分割模型在非洲地区的应用效果不佳。
北京航空航天大学的研究人员针对这些问题开展了系统性研究。他们首先基于Sentinel-2卫星数据和数字地球非洲平台,构建了覆盖整个非洲大陆的AWS16K数据集,包含16,888张340×340分辨率的图像-掩模对。为解决标注难题,研究团队创新性地采用人工标注与基于随机森林的树模型自动标注相结合的混合标注方法,显著提高了标注效率和质量。
为应对小水体和特征混淆的挑战,研究人员提出了创新的特征解耦Transformer(FDTran)模型。该模型的核心创新在于发现了深度神经网络高层特征中水体与背景信息的跨层可分离性,并据此设计了非对称跨层特征解耦注意力机制(FDA)。通过将高分辨率低层特征作为引导,FDA模块能够有效解耦高层混合特征中的水体和背景信息,显著提升了小水体的分割精度。
研究采用了多项关键技术方法:1) 基于NDWI(归一化差异水体指数)的混合标注流程;2) 多尺度特征融合架构;3) 非对称跨层注意力机制;4) OHEM(在线难例挖掘)损失函数优化。实验在AWS16K、LandCover.ai和CrackVision12K三个数据集上进行,采用Precision、Recall、F1、IoU等指标进行量化评估。
研究结果显示,FDTran在各项指标上均达到最先进水平。在AWS16K测试集上,以mit_b5为骨干网络的FDTran实现了78.59%的水体IoU和87.44%的hIoU(调和IoU),较基线模型SegFormer分别提升1.7%和1.12%。特别是在细小水体分割方面,FDTran展现出显著优势,如对河流支流和零星雪盖的识别准确率明显高于对比模型。
通过热力图可视化分析发现,FDTran能够有效解耦高层特征中的水体信息。如图9所示,经过FDA处理后的Fipos特征图能准确聚焦水体区域,而Fineg则主要包含背景信息。不同分辨率路径的特征图各具特点:F2pos保留更多细节但含有少量背景噪声,F4pos则提供粗粒度但纯净的水体特征。
这项研究发表在《International Journal of Applied Earth Observation and Geoinformation》上,具有多重重要意义:首先,AWS16K是首个覆盖全非洲的水体分割数据集,填补了该领域的数据空白;其次,FDTran提出的特征解耦机制为小目标分割提供了新思路;最后,该研究为非洲水资源监测和管理提供了可靠的技术支持,有助于优化水资源配置,缓解水资源短缺问题。研究团队已公开代码和数据集,这将进一步推动相关研究的发展。
生物通微信公众号
知名企业招聘