粒度不一致Transformer：无监督高光谱异常检测的新突破

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》：Granularity-Inconsistent Transformer for Unsupervised Hyperspectral Anomaly Detection

【字体：大中小】 时间：2026年01月05日 来源：IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing 5.4

编辑推荐：

　　本文针对高光谱异常检测中空间特征捕获不足的问题，提出了一种基于粒度不一致Transformer的无监督检测方法GIFormer。研究通过多维协同注意力机制增强背景与异常的对比度，采用块级编码器抑制异常重建，并结合像素级解码器优化细节还原。实验表明，该方法在三个公开数据集上实现了最先进的检测精度，显著提升了复杂场景下的异常分离能力。

在遥感技术与计算机视觉交叉领域，高光谱异常检测（Hyperspectral Anomaly Detection, HAD）一直是一项具有挑战性的任务。高光谱图像（Hyperspectral Images, HSIs）通过数百个连续光谱波段捕获从可见光到红外波段的信息，能够揭示地表物体细微的光谱差异，因此在环境监测、军事侦察、工业质检等领域具有广泛应用。然而，传统方法依赖人工设计特征或对数据分布进行简单假设，难以应对高维复杂场景。尤其是异常像素通常具有稀疏分布特性，现有深度学习模型往往侧重于光谱向量重建，却忽略了空间结构信息，导致语义丢失和检测精度受限。

为解决这一难题，中国石油大学（华东）的王聪团队在《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》上发表了一项创新研究，提出名为GIFormer（Granularity-Inconsistent Transformer）的无监督高光谱异常检测框架。该研究首次将粒度不一致思想引入Transformer架构，通过块级与像素级重建的协同作用，实现了背景与异常的高效分离。

研究方法的核心技术路径包含三个关键模块：首先，设计多维协同注意力（Multidimensional Collaborative Attention, MCA）模块，通过并行计算高度、宽度和通道维度的注意力权重，强化空间-光谱特征的交互，凸显异常与背景的差异性。其次，构建块级异常抑制Transformer编码器，通过自掩码注意力（Self-mask Attention）机制阻断异常块的重建路径，仅保留背景特征。最后，引入像素级重建Transformer解码器，采用代理注意力（Agent Attention）算法以线性计算复杂度实现精细化的像素级重建，解决块级处理导致的边界模糊问题。实验数据来源于HYDICE、San Diego机场和Pavia三个公开高光谱数据集，覆盖车辆、飞机等典型异常目标。

研究结果部分通过定量与定性分析验证了GIFormer的优越性。在检测精度方面，GIFormer在San Diego I、San Diego II和Pavia数据集上的AUC(P_d, P_f)分别达到0.9930、0.9910和0.9995，显著优于对比方法（如GT-HAD和PUNNet）。值得注意的是，在异常目标集中分布的Pavia数据集中，GIFormer几乎完全消除了背景误报（AUC(P_f, τ)低至0.0053），而传统统计方法RX（Reed-Xiaoli）因全局分布假设局限，误报率高达0.0199。

可视化结果进一步印证了定量分析。如图5-8所示，GIFormer在San Diego机场数据集中清晰定位了飞机目标，且背景重建残差图中噪声显著少于其他方法。相比之下，基于卷积神经网络的Auto-AD方法因身份映射特性，在大型异常重建中难以抑制异常特征，导致残差图与真实标注偏差较大。此外，箱线图（图11）显示GIFormer的异常值与背景值分布间隔最远，证明其具有更强的异常分离能力。

消融实验（表III）揭示了各模块的贡献：移除MCA模块后，HYDICE数据集的检测精度下降至0.9115，证明空间-光谱协同建模对复杂背景区分至关重要；而禁用自掩码机制则导致所有数据集性能显著退化，验证了异常抑制策略的有效性。代理注意力机制在保持精度的同时，将解码器推理时间降低至传统自注意力算法的60%（表V），体现了算法的高效性。

讨论部分指出，GIFormer的优势在于其多粒度重建机制能够适应不同规模的异常目标。然而，研究也承认该方法对HYDICE数据集中像素级分散异常的检测性能相对较弱（AUC(P_d, P_f)为0.9286），因块级处理可能模糊细微异常特征。未来工作将聚焦于多尺度自适应机制与轻量化设计，以提升对稀疏异常的敏感性。

这项研究的创新性在于突破了传统Transformer在遥感图像处理中的单一粒度局限，通过编码器-解码器的粒度不一致设计，实现了全局模式捕获与局部细节保留的平衡。其提出的MCA注意力机制为高光谱数据多维特征融合提供了新思路，而代理注意力算法则为大规模遥感图像的实时处理提供了技术支撑。这些成果不仅推动了无监督异常检测的发展，也为遥感智能解译算法设计提供了重要参考。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号