双分支D-WNet：一种融合光学与时间序列SAR特征的云覆盖遥感图像分类方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《International Journal of Digital Earth》：Dual-branch D-WNet: a classification method for cloudy remote sensing images integrating optical and time-series sar features

【字体：大中小】 时间：2026年06月09日 来源：International Journal of Digital Earth 4.9

编辑推荐：

　　光学影像与时间序列合成孔径雷达（SAR）数据的多模态融合对于持续多云区域的土地利用与土地覆盖（LULC）分类至关重要。然而，模态间固有的时空异质性常常阻碍有效的特征对齐，使得传统融合技术在动态场景中表现欠佳。为克服这些限制，研究人员提出了动态加权网络（D-WN

光学影像与时间序列合成孔径雷达（SAR）数据的多模态融合对于持续多云区域的土地利用与土地覆盖（LULC）分类至关重要。然而，模态间固有的时空异质性常常阻碍有效的特征对齐，使得传统融合技术在动态场景中表现欠佳。为克服这些限制，研究人员提出了动态加权网络（D-WNet），一种旨在显式解耦并自适应协同异构多模态输入的双分支框架。该架构利用深度可分离卷积（DSC）对光学影像进行多尺度空间-光谱分析，并采用卷积长短期记忆网络（ConvLSTM）单元从SAR序列中捕获时间散射动态。此外，提出的增强自适应融合模块借助局部-全局双注意力（LGDA）机制动态整合特征，而跨层残差引导策略则用于细化边界描绘并抑制SAR斑点噪声。在多样景观上的评估——包括青藏高原、中国西北部和加利福尼亚州——表明，该框架优于现有方法，总体精度提升了6.8%–12.4%。通过有效融合光学光谱特征与时间序列SAR响应，D-WNet为持续多云环境下的精准土地覆盖制图提供了稳健的解决方案。

论文解读文章

**研究背景与问题**
遥感技术是地球观测的关键手段，在气候变化研究与环境监测中发挥重要作用。近年来，基于深度学习的方法（尤其是卷积神经网络CNN）显著提升了光学影像的分类精度，能够实现大范围内的精细制图。然而，光学数据存在两大主要限制：其一，在热带雨林、季风湿地等区域，频繁的云层与雾霾常阻碍光学影像获取，导致时间连续性降低；其二，单时间光学影像无法捕捉土地覆盖的动态变化（如季节性水体波动），分类结果缺乏时间一致性。相比之下，时间序列SAR影像具有全天候、穿云能力，能在恶劣天气下持续监测地表后向散射动态，但其空间分辨率受雷达波长与多视处理制约，在精细分类任务中表现欠佳。因此，有效融合光学影像与时间序列SAR数据，充分利用它们的互补性，成为提升分类精度的关键。现有融合策略（决策级、特征级、注意力机制）存在特征交互效率低、梯度冲突、全局特征主导而忽略局部动态线索等问题，未能充分解耦静态光学表示与动态SAR特性，且权重分配机制缺乏对时空变化的动态响应，导致复杂场景下精度受限。

**研究内容与结论**
为克服上述局限，研究人员提出动态加权网络（D-WNet），一种分层跨模态融合框架。D-WNet利用深度可分离卷积提取静态光学纹理，基于ConvLSTM的分支建模SAR动态，并通过多头门控注意力机制动态融合特征，协同密集连接与自适应门控。该研究旨在：(1)建立分层双流架构实现特征解耦；(2)设计自适应融合机制自主平衡模态贡献；(3)在三个不同区域验证模型鲁棒性。实验结果表明，D-WNet在青藏高原扎陵湖-鄂陵湖盆地、中国甘肃与加州中部三个数据集上均优于现有方法，总体精度提升6.8%–12.4%，能够有效融合光学光谱特征与时间序列SAR响应，为持续多云环境下的精准土地覆盖制图提供稳健方案。该论文发表在《International Journal of Digital Earth》。

**关键技术方法**（不超过250字）
D-WNet的核心技术包括：光学特征提取采用堆叠的深度可分离卷积（DSC），实现多尺度空间-光谱分析；SAR时间序列建模采用卷积长短期记忆网络（ConvLSTM），捕获月尺度后向散射演变；增强自适应特征融合模块（Enhanced AFF）整合了局部-全局双注意力机制（用于空间响应与通道重要性动态校准）、多头门控自注意力（子空间特征解耦）以及上下文残差路径（注入多尺度背景信息）。解码阶段使用跨层残差引导策略，通过密集残差连接融合浅层与深层特征并抑制SAR噪声。训练采用三阶段策略，逐步解冻参数并调整学习率。样本源自三个区域：高原湿地（专家解译标签）、甘肃（基于GLC-FCS30产品简化）、加州中部（基于NLCD简化），数据预处理在GEE平台完成，包括云检测、大气校正、SAR噪声去除与配准。

**研究结果**
**1. 精度评估（Precision evaluation）**
通过与单源基线（U-Net、L-UNet、U-Net3+、ConvLSTM）和多种多模态融合方法（ConcatenationNet、FeatureWeightNet、WeightedVoteNet、CrossAttentionNet、KCCA、CloudSeg）对比，D-WNet在扎陵湖-鄂陵湖（Z-E Lake）数据集上取得86.58%的总体精度（OA），在甘肃数据集上取得78.89%的OA，在加州数据集上取得81.58%的OA（Kappa 0.782）。相比最强基线，提升幅度在统计上显著（p<0.05）。类别精度分析表明，D-WNet在大多数类别中获得最高或接近最高的精度，尤其在类别混淆较强的区域表现一致。

**2. 分类效果（Classification effect）**
可视化结果（图6-8）显示，在云覆盖频繁的子区域，D-WNet生成的分类图比CrossAttentionNet和KCCA更为连贯、噪声更少，尤其在精细结构（如水体-草地边界）上能保持清晰细节。全局分类图（图9-11）进一步展示了三个区域的高空间一致性，即使在持续多云区域也是如此，说明局部-全局注意力与密集残差连接有助于保持边界连续性并抑制噪声。

**3. 消融实验（Ablation experiment）**
系统消融实验验证了三个核心模块的必要性：去除SAR分支导致OA下降5.37%–8.37%（云重区域下降更明显）；去除光学分支在晴朗条件下OA下降超过10%；去除局部或全局注意力机制使OA下降约3%–4%；去除残差引导解码策略导致OA下降1.56%–2.71%。这些结果表明双分支设计、自适应融合与残差引导策略均对最终性能有重要贡献。

**讨论总结**
论文讨论部分首先分析了D-WNet的机制优势：(1)双流特征解耦机制有效缓解了异构数据融合中的跨模态污染问题，光学分支保留静态细节，SAR分支捕获动态散射，减少干扰；(2)增强自适应特征融合模块通过局部-全局双注意力动态调整特征权重，在云覆盖区域降低光学贡献并增强SAR权重，清晰/多云条件下权重分配明确（晴朗时光学权重>85%，多云时光学权重<25%而SAR VV/VH权重上升至39.7%/36.8%）；(3)模型在小样本条件下仍保持较高精度，泛化能力在三个地理异质区域均表现稳健。此外，模型在不同云量场景中的自适应行为通过注意力图与权重定量分析得到验证，显示其像素级数据质量驱动的融合策略。论文也指出了局限性：训练成本相对较高、固定12个月SAR输入对快速变化事件敏感性有限、未进行完全遮蔽云层下的专用合成实验。

**结论翻译**
本研究提出了一个双分支D-WNet框架，用于持续多云和降雨区域的光学-SAR土地覆盖分类。通过结合深度可分离卷积进行光学特征提取、ConvLSTM进行SAR时间建模，以及增强自适应融合模块进行跨模态集成，该方法改善了来自光学与时间序列SAR数据互补信息的利用。在扎陵湖-鄂陵湖、甘肃和加州数据集上的实验结果表明，D-WNet在复杂观测条件下实现了强大且稳定的分类性能。结果进一步表明，双流设计有助于减少异构特征间的干扰，而自适应融合机制则帮助根据数据质量调整光学与SAR信息的相对贡献。此外，残差引导解码策略有助于在最终分类输出中保留空间细节并抑制SAR噪声。总体而言，D-WNet为云易发环境下的多模态土地覆盖分类提供了一个有效的框架。未来的工作可进一步评估其在热带雨林和季风区等更复杂区域的适用性，并探索更灵活的时间输入和更高效的训练策略。

联系信箱：

粤ICP备09063491号

热点排行