知识数据双驱动的极化合成孔径雷达图像深度学习分类模型研究

《Results in Engineering》：Knowledge and Data Co-driven Deep Learning Model for PolSAR Image Classification

【字体：大中小】 时间：2026年01月02日 来源：Results in Engineering 7.9

编辑推荐：

　　本文针对传统数据驱动的深度学习模型在极化合成孔径雷达(PolSAR)图像分类中忽略物理特性、可解释性差的问题，提出了一种知识数据双驱动的卷积变分自编码器(PK-ConVAE)模型。该研究通过引入物理引导模块和物理约束模块，将Freeman分解等物理知识嵌入网络建模过程，在三个真实数据集上的实验表明，该方法在有限样本下显著提升了分类精度和模型鲁棒性，为物理可解释的深度学习模型提供了新思路。

极化合成孔径雷达(PolSAR)作为一种重要的主动微波遥感技术，具有全天时、全天候观测的优势，在军事侦察、环境监测等领域发挥着关键作用。然而，PolSAR图像解译一直面临着严峻挑战：独特的微波成像机制使得复杂散射目标难以视觉区分，相干斑噪声严重影响图像质量，而传统分类方法高度依赖专家知识设计特征，过程繁琐且泛化能力有限。

近年来，深度学习技术为PolSAR图像分类带来了革命性进展。以卷积神经网络(CNN)为代表的数据驱动方法能够自动学习特征表示，在分类任务上取得了显著成效。但这类"黑箱"模型存在明显局限：一方面，它们需要大量标注样本进行训练，而PolSAR图像的人工标注成本高昂；另一方面，模型完全依赖数据统计规律，忽略了电磁散射物理机制，导致学到的特征缺乏物理解释性，在复杂场景下的分类结果常出现物理不合理的情况。

面对这些挑战，华文强、王毅、杨子寒在《Results in Engineering》上发表的研究工作中，创新性地提出了一种知识数据双驱动的深度学习模型PK-ConVAE。该研究的核心思路是将物理先验知识嵌入深度学习框架，使网络能够学习具有物理意义的高层语义特征，从而在有限标注样本条件下实现更准确、更可靠的分类。

研究人员采用卷积变分自编码器(ConVAE)作为基础框架，在此基础上设计了两个关键模块：物理引导模块和物理约束模块。物理引导模块通过将Freeman分解提取的散射功率特征（包括冠层散射P_v、表面散射P_s和二面角散射P_d）与卷积自编码器提取的潜在特征相结合，引导网络学习具有物理意义的深度特征。物理约束模块则在输出空间引入一致性惩罚项，利用散射模型的物理特性对分类器输出类别进行约束，确保分类结果符合物理规律。

在技术方法上，该研究主要基于三个真实PolSAR数据集（西安数据集、旧金山I数据集和旧金山II数据集）进行验证，采用卷积变分自编码器架构，结合Freeman极化目标分解技术提取物理特征，通过物理约束损失函数优化模型，并在有限标注样本（仅1%）条件下进行训练和评估。

3.1. PolSAR数据的幅度特征

研究首先从PolSAR数据的基本表征入手，利用极化相干矩阵T的对角线元素及上三角元素的实部和虚部作为输入特征。这些特征能够充分表达地物目标的极化散射特性，为后续深度学习提供丰富的信息基础。

3.2. PolSAR数据的散射特征

通过Freeman分解将地物目标分为三种散射机制：冠层散射（主要存在于森林等异质介质环境）、表面散射（道路、水体等平面结构）和二面角散射（建筑物等二面体结构）。这种基于物理机制的特征表示为知识驱动提供了理论基础。

3.3. 卷积自编码器

研究采用卷积自编码器(CAE)处理图像数据，避免了全连接结构破坏空间信息的问题。该模块通过编码器-解码器结构学习数据的有效表示，并以最小化重构误差为目标进行无监督训练。

3.4. 物理知识驱动的PolSARCAE

这是本文的核心创新点。PK-ConVAE模型包含三个组成部分：CAE模块、物理引导模块和物理约束模块。损失函数由四部分组成：重构损失(Loss_rec)、潜在变量损失(Loss_latent)、分类损失(Loss_cls)和物理不一致惩罚项(Loss_phy)。这种设计使得模型能够同时利用数据统计规律和物理先验知识。

4.1. 实验数据集

研究在三个广泛使用的PolSAR数据集上验证方法有效性：西安数据集（RadarSAT-2获取，512×512像素，3类）、旧金山I数据集（AIRSAR获取，900×1024像素，3类）和旧金山II数据集（RadarSAT-2获取，1300×1300像素，5类）。数据集的多样性确保了实验结果的普适性。

4.2. 实验设置

实验采用5%样本进行无监督预训练，1%标注样本进行有监督训练，所有实验独立重复10次，以总体精度(OA)和Kappa系数作为评价指标。与CNN、AE、CAE、ConVAE等9种方法进行对比，确保比较的公平性。

4.3. 参数分析

通过系统实验确定了最佳超参数配置：邻域窗口大小为21×21像素，训练轮数为170，批大小为17，学习率为0.0005。这些细致的参数调优为模型性能提供了保障。

4.4. 实验结果

在三个数据集上的实验结果表明，PK-ConVAE方法均取得了最优分类性能。在西安数据集上，OA达到93.36%，Kappa系数为89.06%；在旧金山I数据集上，OA为98.81%，Kappa为97.91%；在旧金山II数据集上，OA为99.21%，Kappa为98.81%。显著优于其他对比方法。

4.4.1. 西安数据集实验结果

PK-ConVAE在城区和滩地分类上表现尤为突出，有效减少了传统方法中常见的误分类现象，证明了物理约束在区分散射机制相似地物方面的优势。

4.4.2. 旧金山I数据集实验结果

该数据集包含植被、水体和城区三类目标，PK-ConVAE在保持各类别高精度的同时，显著提升了植被与城区交界处的分类一致性。

4.4.3. 旧金山II数据集实验结果

针对五类更精细的地物分类任务，PK-ConVAE在低密度城区、高密度城区和已开发区域等难以区分的类别上展现了卓越的判别能力。

4.5. 讨论与分析

通过特征可视化和鲁棒性实验进一步验证了方法有效性。t-SNE可视化显示，PK-ConVAE学习到的特征具有更好的类内聚集性和类间分离性。鲁棒性实验表明，该方法在训练测试样本分布不一致时仍能保持稳定性能，体现了良好的泛化能力。

该研究的创新性在于成功将物理知识与深度学习模型相结合，突破了传统数据驱动方法对大量标注数据的依赖，提高了模型的可解释性和物理一致性。通过设计物理引导和物理约束机制，使网络能够学习符合电磁散射原理的特征表示，在有限样本条件下实现了优越的分类性能。

这项研究为PolSAR图像解译提供了一种新范式，证明了知识驱动与数据驱动融合的巨大潜力。随着多源遥感数据的不断丰富和深度学习理论的深入发展，这种物理可解释的深度学习框架有望在环境监测、灾害评估、城市规划等领域发挥更重要作用，推动遥感图像解译从"黑箱"向"白箱"转变。未来研究可进一步探索更多物理模型的嵌入方式，以及知识驱动机制在其他遥感任务中的应用前景。

热点排行

新闻专题