粒度不一致Transformer:无监督高光谱异常检测的新突破

《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》:Granularity-Inconsistent Transformer for Unsupervised Hyperspectral Anomaly Detection

【字体: 时间:2026年01月05日 来源:IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing 5.4

编辑推荐:

  本文针对高光谱异常检测中空间特征捕获不足的问题,提出了一种基于粒度不一致Transformer的无监督检测方法GIFormer。研究通过多维协同注意力机制增强背景与异常的对比度,采用块级编码器抑制异常重建,并结合像素级解码器优化细节还原。实验表明,该方法在三个公开数据集上实现了最先进的检测精度,显著提升了复杂场景下的异常分离能力。

  
在遥感技术与计算机视觉交叉领域,高光谱异常检测(Hyperspectral Anomaly Detection, HAD)一直是一项具有挑战性的任务。高光谱图像(Hyperspectral Images, HSIs)通过数百个连续光谱波段捕获从可见光到红外波段的信息,能够揭示地表物体细微的光谱差异,因此在环境监测、军事侦察、工业质检等领域具有广泛应用。然而,传统方法依赖人工设计特征或对数据分布进行简单假设,难以应对高维复杂场景。尤其是异常像素通常具有稀疏分布特性,现有深度学习模型往往侧重于光谱向量重建,却忽略了空间结构信息,导致语义丢失和检测精度受限。
为解决这一难题,中国石油大学(华东)的王聪团队在《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》上发表了一项创新研究,提出名为GIFormer(Granularity-Inconsistent Transformer)的无监督高光谱异常检测框架。该研究首次将粒度不一致思想引入Transformer架构,通过块级与像素级重建的协同作用,实现了背景与异常的高效分离。
研究方法的核心技术路径包含三个关键模块:首先,设计多维协同注意力(Multidimensional Collaborative Attention, MCA)模块,通过并行计算高度、宽度和通道维度的注意力权重,强化空间-光谱特征的交互,凸显异常与背景的差异性。其次,构建块级异常抑制Transformer编码器,通过自掩码注意力(Self-mask Attention)机制阻断异常块的重建路径,仅保留背景特征。最后,引入像素级重建Transformer解码器,采用代理注意力(Agent Attention)算法以线性计算复杂度实现精细化的像素级重建,解决块级处理导致的边界模糊问题。实验数据来源于HYDICE、San Diego机场和Pavia三个公开高光谱数据集,覆盖车辆、飞机等典型异常目标。
研究结果部分通过定量与定性分析验证了GIFormer的优越性。在检测精度方面,GIFormer在San Diego I、San Diego II和Pavia数据集上的AUC(Pd, Pf)分别达到0.9930、0.9910和0.9995,显著优于对比方法(如GT-HAD和PUNNet)。值得注意的是,在异常目标集中分布的Pavia数据集中,GIFormer几乎完全消除了背景误报(AUC(Pf, τ)低至0.0053),而传统统计方法RX(Reed-Xiaoli)因全局分布假设局限,误报率高达0.0199。
可视化结果进一步印证了定量分析。如图5-8所示,GIFormer在San Diego机场数据集中清晰定位了飞机目标,且背景重建残差图中噪声显著少于其他方法。相比之下,基于卷积神经网络的Auto-AD方法因身份映射特性,在大型异常重建中难以抑制异常特征,导致残差图与真实标注偏差较大。此外,箱线图(图11)显示GIFormer的异常值与背景值分布间隔最远,证明其具有更强的异常分离能力。
消融实验(表III)揭示了各模块的贡献:移除MCA模块后,HYDICE数据集的检测精度下降至0.9115,证明空间-光谱协同建模对复杂背景区分至关重要;而禁用自掩码机制则导致所有数据集性能显著退化,验证了异常抑制策略的有效性。代理注意力机制在保持精度的同时,将解码器推理时间降低至传统自注意力算法的60%(表V),体现了算法的高效性。
讨论部分指出,GIFormer的优势在于其多粒度重建机制能够适应不同规模的异常目标。然而,研究也承认该方法对HYDICE数据集中像素级分散异常的检测性能相对较弱(AUC(Pd, Pf)为0.9286),因块级处理可能模糊细微异常特征。未来工作将聚焦于多尺度自适应机制与轻量化设计,以提升对稀疏异常的敏感性。
这项研究的创新性在于突破了传统Transformer在遥感图像处理中的单一粒度局限,通过编码器-解码器的粒度不一致设计,实现了全局模式捕获与局部细节保留的平衡。其提出的MCA注意力机制为高光谱数据多维特征融合提供了新思路,而代理注意力算法则为大规模遥感图像的实时处理提供了技术支撑。这些成果不仅推动了无监督异常检测的发展,也为遥感智能解译算法设计提供了重要参考。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号