
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于自相关与跨空间相关注意力机制的SCNet模型:小样本图像分类的新突破
【字体: 大 中 小 】 时间:2025年05月21日 来源:Engineering Science and Technology, an International Journal 5.1
编辑推荐:
针对小样本学习中类内特征多样性不足及支持-查询图像特征对齐困难的问题,研究人员提出SCNet框架,通过自相关注意力(SCA)模块增强局部特征提取,结合跨空间相关注意力(CSC)模块优化特征对齐,实验表明其在Mini-ImageNet等数据集上显著优于现有方法,为小样本分类提供了高效解决方案。
在人工智能蓬勃发展的今天,计算机视觉领域面临着一个关键挑战:如何让模型像人类一样,仅通过少量样本就能快速识别新类别?这一挑战在小样本学习(Few-shot Learning)领域尤为突出。尽管深度学习在拥有海量标注数据的任务中表现出色,但在医疗影像分析、稀有物种识别等实际场景中,获取大量标注数据往往耗时费力甚至不可行。现有小样本学习方法常陷入两难困境:一方面,类内特征多样性捕捉不足,忽视了对判别性局部细节的关注;另一方面,支持集和查询集图像间的特征对齐效果欠佳,导致模型难以建立有效的跨样本关联。
针对这些瓶颈,中国的研究团队在《Engineering Science and Technology, an International Journal》发表了创新性研究。他们开发的SCNet框架通过双重注意力机制突破传统局限:自相关注意力(Self-Correlational Attention, SCA)模块像"显微镜"般聚焦图像关键区域,通过局部特征相关性计算(如公式(1)中的Hadamard乘积)强化判别性特征;跨空间相关注意力(Cross Spatial-Correlation Attention, CSC)模块则充当"桥梁",利用通道和空间注意力权重(公式(5)-(6))建立支持-查询图像间的语义关联。研究采用端到端训练策略,结合标签分类损失和度量损失(公式(11)),在Mini-ImageNet、CUB-200-2011和CIFAR-FS数据集上实现最高81.19%的1-shot分类准确率。
关键技术方面,研究以ResNet-12为骨干网络,通过5×5滑动窗口的局部相关性计算构建SCA模块,采用CBAM启发的双路注意力设计CSC模块。实验使用标准N-way K-shot评估协议,每个任务包含15个查询样本,通过2000次随机采样确保统计显著性。
研究结果部分,"3.2 SCA模块"揭示:通过压缩特征通道至C'=64并计算邻域相关性(U,V=5),该模块在CUB数据集上使基线模型提升1.46%。"3.3 CSC模块"显示:结合通道注意力Mc和空间注意力Ms的加权融合(公式(7)),显著改善特征对齐效果。在"4.3 与先进方法对比"中,SCNet以81.19%准确率超越QSFormer等模型,且在训练效率上较DeepBDC节省88%时间。"4.4 消融研究"证实:SCA+CSC组合使ResNet-12在Mini-ImageNet上提升2.41%,其(5,5)滑动窗口设计最优。
这项研究的突破性在于:SCA模块首次将局部自相关计算引入小样本特征增强,通过Z'→D→G的特征演化路径(公式(2)-(4))保留关键语义;CSC模块创新的交叉注意力机制,通过Mc(q)×Ms(s)的权重分配(公式(6))实现精准特征匹配。研究不仅为小样本分类提供了新范式,其模块化设计更可迁移至目标检测等任务。正如可视化分析所示(图8-9),SCNet能准确聚焦鸟类喙部、花瓣纹理等判别区域,这种可解释性对医疗诊断等高风险应用尤为重要。未来工作可探索该框架与Transformer的融合,进一步提升跨尺度特征建模能力。
生物通微信公众号
知名企业招聘