
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度学习卫星影像分割的土地利用与土地覆盖分类优化研究
【字体: 大 中 小 】 时间:2025年09月24日 来源:International Journal of Applied Earth Observation and Geoinformation 8.6
编辑推荐:
本研究针对卫星影像语义分割在复杂地理区域分类精度不足的问题,系统评估了UNet、LinkNet、DeepLabV3+及改进型AE-DeepLabV3+等深度学习模型与多种骨干网络的组合性能。研究构建了埃塞俄比亚高分辨率数据集,采用XAI技术增强模型可解释性,最终AE-DeepLabV3+与Xception骨干网络组合取得91.3%的Dice系数,为精准土地覆盖分类提供了创新解决方案。
随着遥感技术的飞速发展,卫星影像已成为监测地球表面变化的“天眼”。从茂密的热带雨林到不断扩张的都市圈,从蜿蜒的河流到纵横交错的农田,如何准确解读这些复杂的地理信息,一直是环境科学领域的重大挑战。传统的土地覆盖分类方法往往力不从心——低分辨率影像中一个像素可能包含多种地物类型,人工分析既耗时又容易出错,而现有研究多局限于特定区域,缺乏能够通用的大规模标注数据集。
在非洲大陆的东北角,埃塞俄比亚以其独特的地形地貌著称:从低于海平面125米的达纳基尔洼地,到海拔4550米的拉斯达申峰,从炎热的低谷到寒冷的高原,这里的土地覆盖类型极其复杂。正是这种多样性,使得埃塞俄比亚成为测试土地分类算法的绝佳实验室,但也同时带来了巨大挑战——如何区分外观相似的灌木丛和草地?如何准确识别零散的居民区?这些问题催生了这项发表在《International Journal of Applied Earth Observation and Geoinformation》上的创新研究。
研究团队采用多源卫星数据融合策略,整合了Terra Incognita应用(0.5米)、Google Earth(0.5-15米)、Sentinel-2A/2B(10米)和Landsat 8/9(30米)等多分辨率影像。通过LabelMe工具进行像素级标注,构建包含17,814个256×256图像块的数据集,涵盖森林、农田、道路、水体等8类地物。研究采用归一化、数据增强(随机亮度调整、水平垂直翻转)和迭代分层分割等预处理技术,确保类别平衡。核心方法包括四种深度学习架构(UNet、LinkNet、DeepLabV3+、AE-DeepLabV3+)与五种骨干网络(ResNet101/152、Xception、MobileNetV2、EfficientNetV2)的组合评估,采用Dice损失与分类交叉熵的联合损失函数,并集成SE注意力机制。通过Seg-Grad-CAM++和Seg-Score-CAM等XAI技术实现决策过程可视化。
3.1. Unet with different backbone models
UNet架构配合不同骨干网络的测试表明,Xception骨干表现最优,验证集Dice系数达85.7%,准确率86.3%。混淆矩阵显示水体(0.95)、建成区(0.91)和农地(0.91)分类准确度高,但灌木丛(0.68)易与森林(0.11)和草地(0.14)混淆。Xception的深度可分离卷积结构在参数效率上比ResNet152提升50.7%。
3.2. Linknet with different backbones models
LinkNet结合ResNet152骨干取得最佳性能,Dice系数86.7%,准确率88.42%。该架构在建成区(精度0.93)和道路(精度0.91)分类上表现突出,但草地与灌木丛的光谱相似性仍导致分类困难,灌木丛Dice系数仅74%。
3.3. DeeplabV3+ with different backbones models
DeepLabV3+配合Xception骨干达到90.6%Dice系数,其ASPP模块有效捕获多尺度上下文信息。水体分类表现极佳(Dice 96.8%,IoU 93.8%),灌木丛分类性能提升至Dice 86.6%。
3.4. AE-DeepLabV3+ with different backbones models
集成SE注意力机制的改进模型表现最优,Xception骨干组合在测试集达到91.9%Dice系数和92.1%准确率。注意力机制显著提升了对复杂地物的区分能力,水体(97%)和农地(95.2%)分类近乎完美,灌木丛分类提升至87.5%。
3.5. Comparisons of different deep learning architecture
综合比较显示AE-DeepLabV3+与Xception骨干组合在所有评估指标中领先,其注意力机制有效增强了对细微特征的捕捉能力。Xception骨干的深度可分离卷积在计算效率和特征提取间达到最佳平衡。
3.6. Explainable AI (XAI) results
XAI可视化揭示了模型决策依据:Seg-Grad-CAM++擅长捕捉复杂区域的分布式特征,在农田和草地类别IoU分别达94%和90%;Seg-Score-CAM则更擅长边界精确定位,在森林类别IoU达84%。误差分析显示模型在边界区域和遮挡情况下面临挑战。
3.7. Comparisons with other works
与近年同类研究相比,本研究在8分类任务中表现优异,优于Wang等(2024a)的DeepGDLE模型(IoU 65.89%)、Boonpook等(2023)的LoopNet(IoU 71.69%)和Tzepkenlis等(2023)的U-TAE模型(IoU 57.25%)。
研究结论表明,集成注意力机制的AE-DeepLabV3+架构在土地覆盖分类中表现出色,其91.9%的Dice系数和92.1%的准确率设定了新的性能标杆。该方法不仅精度高,且具有强大的泛化能力,在大范围地理区域测试中保持稳定性能。研究的创新点在于:构建了埃塞俄比亚首个高分辨率土地覆盖数据集;系统评估了多种深度学习架构与骨干网络的组合性能;首次在卫星影像分割中集成SE注意力机制并验证其有效性;采用XAI技术增强模型透明度。
这项研究的科学价值在于为解决全球土地覆盖监测中的核心挑战提供了创新方案,其方法论可推广至不同地理环境,为可持续发展目标(SDGs)中的气候行动(SDG13)和生物多样性保护(SDG15)提供了技术支撑。未来研究方向包括开发轻量化模型、探索无监督学习策略,以及将像素级分类与对象基方法相结合,进一步提升分类精度和实用性。
生物通微信公众号
知名企业招聘