编辑推荐:
在多源遥感(RS)图像分类中,标记样本稀缺影响分类精度。研究人员提出伪标签生成引导的半监督网络(PGS2Net)用于高光谱(HS)图像和 LiDAR 数据分类。实验表明该方法性能卓越,为多源 RS 图像分类提供了新方案。
在当今的地球观测任务里,多源遥感图像的协同运用已然成为大势所趋。高光谱(HS)图像能够呈现丰富的光谱信息,就像为地面物体绘制了一张张独特的 “光谱指纹”,让我们可以从光谱的角度去识别和区分不同的地物;而光探测与测量(LiDAR)数据则像是一位 “空间测绘师”,能提供精准的地形高程信息,不受大气条件的干扰。这两者的优势互补,为提升地物分类性能带来了无限可能。
然而,现实的难题却横亘在前。目前,大多数深度神经网络要想达到高分类精度,往往依赖大量预先标记的数据。可对于遥感数据来说,收集和标记样本可不是一件容易的事。地球表面地理环境复杂多样,区域范围广袤无垠,很多地方人迹罕至,获取样本的过程需要耗费大量的人力和财力。而且,要实现高质量的标注,还需要具备专业的领域知识,而遥感图像解译方面的专业人才又十分稀缺。这就好比在攀登高峰的路上,标注数据的匮乏成为了一道难以跨越的沟壑。
半监督学习(SSL)方法的出现,给解决这一难题带来了希望。它可以将少量的标记数据和大量的未标记数据结合起来,既减少了对大量标记样本的依赖,又能挖掘未标记数据中潜在的结构信息。但现有的基于伪标签的半监督技术也存在不少问题。一方面,分配给未标记样本的伪标签可信度过度依赖特征提取的质量。现有的 HS 图像和 LiDAR 数据特征提取方法,常常只依靠深度神经网络,却忽视了特征的可区分性、类别稳健性以及少量标记样本下的过拟合问题,导致伪标签的可信度计算不可靠。另一方面,模型训练过程中生成的伪标签常常包含许多错误标记。很多算法采用高且固定的阈值来筛选伪标签,可由于不同类别学习难度存在差异,容易学习的类别更容易被选中,而难分类的类别则被忽视,最终影响了分类的准确性。
为了攻克这些难题,研究人员开展了关于伪标签生成引导的半监督网络用于高光谱图像和 LiDAR 数据分类(PGS2Net)的研究。他们提出了一种全新的网络架构,旨在充分利用 HS 和 LiDAR 的特征,在标记样本有限的情况下实现精准分类。这一研究成果发表在《Expert Systems with Applications》上,为遥感图像分类领域带来了新的突破和思路。
研究人员在这项研究中运用了多种关键技术方法。在网络架构方面,将传统的卷积神经网络(CNN)框架与特征聚合模块相结合,有效融合了多模态信息。通过构建基于相似信息特征的聚类方案,利用 HS 和 LiDAR 之间的空间互补性,学习同一类别内深度特征的中心,使特征更加紧凑、更具可区分性,提升了特征提取的质量。同时,设计了基于 “学习难度” 获取动态阈值的半监督学习方案,根据不同类别的学习难度确定阈值,更合理地获取伪标签,提高了伪标签的利用率 。
实验数据集选择
研究人员选取了三个具有代表性的公开遥感数据集进行实验,分别是 Houston 2013、Augsburg 和 Trento 数据集。这些数据集充分考虑了不同场景下的土地覆盖分类任务,涵盖了丰富多样的地物类型和地理环境,为验证模型性能提供了有力支撑。
实验环境设置
所有实验均在配备 Intel Xeon Silver 4110 CPU 和 NVIDIA Quadro p6000 GPU 的服务器上进行。这样的硬件配置能够满足复杂模型训练和大量数据处理的需求,确保实验结果的准确性和可靠性。
评估指标设定
采用总体精度(OA)、平均精度(AA)和 Kappa 系数作为评估模型性能的指标。这些指标从不同角度衡量了模型分类的准确性,能够全面、客观地反映模型在不同数据集上的表现。
实验结果分析
在多个数据集上,PGS2Net 与一些最先进(SOTA)的算法进行对比。实验结果令人惊喜,PGS2Net 展现出了卓越的性能。在 Houston 2013 数据集上,其总体精度(OA)、平均精度(AA)和 Kappa 系数相较于其他算法有显著提升,表明该模型能够更准确地识别不同地物类别,减少分类错误。在 Augsburg 和 Trento 数据集上,PGS2Net 同样表现出色,进一步验证了其在不同场景下的有效性和鲁棒性。这意味着 PGS2Net 能够适应复杂多变的地理环境,为实际的土地覆盖分类应用提供了更可靠的技术支持。
消融实验结果
研究人员还进行了消融实验,探究各个模块对模型性能的贡献。结果发现,去除基于相似信息特征的聚类方案模块后,模型的特征提取质量下降,分类精度明显降低,这表明该模块在提升特征可区分性方面发挥了关键作用。而去掉基于 “学习难度” 获取动态阈值的半监督学习方案模块后,模型在难分类类别上的表现变差,说明该模块有效解决了类别不平衡问题,提高了伪标签的利用效率。
研究人员提出的 PGS2Net 成功解决了多源遥感图像伪标签获取质量差和分类精度低的问题。该网络生成的伪标签在保证高质量的同时,实现了样本类别的平衡,并且无需微调就可直接作为训练样本重新输入模型。这一研究成果不仅为高光谱图像和 LiDAR 数据分类提供了新的有效方法,也为半监督学习在遥感领域的应用开辟了新的方向,有助于推动地球观测技术在土地分类、城市规划、农业监测等多个领域的进一步发展,让我们能够更精准、高效地利用遥感数据,更好地认识和保护我们的地球家园。