
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多粒度关系对比学习:提升小样本分类的语义一致性建模
【字体: 大 中 小 】 时间:2025年05月27日 来源:Image and Vision Computing 4.2
编辑推荐:
本文针对小样本学习(FSL)中样本关系建模的语义粒度差异问题,提出多粒度关系对比学习框架(MGRCL)。研究团队通过划分样本关系为同样本变换一致性、同类样本相似性和异类样本区分性三个粒度,设计变换一致性学习(TCL)和类别对比学习(CCL)模块,在miniImageNet等四个基准测试中超越现有方法。该工作为FSL特征提取提供了新范式,其预训练模型可显著提升其他FSL方法的性能。
在人工智能领域,小样本学习(Few-Shot Learning, FSL)始终面临一个核心矛盾:人类只需少量样本就能识别新类别,而深度学习模型却需要海量标注数据。这种矛盾在医疗影像分析、工业质检等实际场景中尤为突出——获取大规模标注数据既昂贵又耗时。尽管现有FSL方法通过元学习(meta-learning)或数据增强(data augmentation)取得进展,但特征提取环节的样本关系建模仍存在明显缺陷:当前对比学习(contrastive learning)方法未能区分不同粒度(如样本自身变换与同类样本)的语义相似性差异,导致特征空间优化不充分。
针对这一瓶颈,重庆大学的研究团队在《Image and Vision Computing》发表研究,提出多粒度关系对比学习(Multi-Grained Relation Contrastive Learning, MGRCL)。该工作创新性地将样本关系解构为三个层次:1)同样本在不同图像变换下的内在一致性(intra-sample relation),2)同类样本的语义相似性(intra-class relation),3)异类样本的区分性(inter-class relation)。通过设计变换一致性学习(Transformation Consistency Learning, TCL)强制同样本不同变换的特征输出对齐,结合类别对比学习(Class Contrastive Learning, CCL)构建同类/异类样本的相对距离约束,实现了特征空间中不同粒度语义关系的精准建模。
关键技术方法包括:1)基于ResNet-12的特征提取框架;2)在miniImageNet、tieredImageNet、CIFAR-FS和CUB-200-2011四个标准数据集上的系统性验证;3)通过交叉熵损失与对比损失的联合优化实现端到端训练;4)采用两阶段评估范式(预训练+小样本微调)验证模型泛化能力。
研究结果
Few-shot learning
实验表明传统FSL方法存在特征迁移性不足的问题。与优化算法设计的meta-learning方法(如MAML)和生成对抗方法(如STVAE)相比,MGRCL通过底层特征优化实现了更优的跨类别知识迁移。
Problem formulation
在N-way K-shot任务设置下,MGRCL在base classes(基类)预训练阶段建立的粒度化关系约束,使模型在novel classes(新类)上5-way 1-shot任务准确率最高提升8.7%。
Datasets
在细粒度分类数据集CUB-200-2011上,MGRCL的1-shot准确率达72.3%,显著优于对比方法IER(65.1%)和PAL(68.9%),验证其对细微特征差异的捕捉能力。
Backbone architectures
采用ResNet-12作为主干网络时,MGRCL仅需标准监督训练的70%数据量即可达到同等性能,证明其数据效率优势。
Limitations in real scenarios
研究同时指出,工业缺陷检测等实际场景中基类数据不足时,模型性能会出现明显下降,这为未来研究指明了改进方向。
结论与意义
该研究通过解构样本关系的语义粒度,建立了首个系统化建模不同粒度关系的FSL框架。其核心贡献在于:1)提出TCL模块保证样本变换下的严格语义不变性;2)设计CCL模块实现同类样本"相对紧密"而非"绝对一致"的优化目标,避免特征空间坍塌;3)验证了简单预训练策略在FSL中的巨大潜力。值得注意的是,MGRCL可作为"即插即用"模块增强现有FSL方法,例如将其特征提取器接入meta-learning框架ProtoNet后,5-way 5-shot性能提升达12.4%。研究团队Guowei Yin、Sheng Huang等强调,这种基于语义粒度的关系建模思想,可延伸至跨模态学习、联邦学习等更广阔领域,为数据稀缺场景的智能模型开发提供新思路。
生物通微信公众号
知名企业招聘