融合原型与邻域关系的任务自适应元学习小样本分类方法研究

【字体: 时间:2025年06月16日 来源:Neural Networks 6.0

编辑推荐:

  针对小样本分类(FSC)中原型网络(PN)对复杂数据分布表征不足的问题,研究人员提出融合原型与邻域网络(NN)的PNN模型,通过任务自适应元学习机制和基于邻域关系的伪标签生成方法,在mini-imageNet等数据集上超越24种先进算法,为跨域医学图像分析提供新思路。

  

在人工智能蓬勃发展的今天,深度神经网络虽在图像分类等领域取得突破,但其对海量标注数据的依赖成为制约发展的瓶颈。特别是在医疗等专业领域,数据标注成本高、隐私保护要求严,使得小样本分类(Few-Shot Classification, FSC)技术成为研究热点。传统原型网络(Prototypical Networks, PN)通过计算类原型实现分类,但面对真实场景中类分布不规则、尺度差异大的情况时,其单一原型假设往往导致模型欠拟合。

针对这一挑战,中国国家自然科学基金重点项目支持的研究团队创新性地将KNN思想引入PN框架,提出原型-邻域网络(Prototype-Neighbor Networks, PNN)。该工作通过三阶段突破:首先设计邻域网络(Neighbor Network, NN)捕捉局部样本关系,与PN的全局原型形成互补;其次在元训练与元测试间插入任务特异性微调阶段,增强模型对新类别的适应能力;最后开发基于原型-邻域一致性的伪标签生成方法,较传统自训练策略降低42%的标签噪声。实验表明,PNN在mini-imageNet和CUB数据集上准确率分别达到72.3%和83.1%,显著优于对比的18种先进方法。相关成果发表于《Neural Networks》,代码已开源。

关键技术方法:研究采用三基准数据集(mini/tiered-imageNet、CUB)和四个医学影像跨域测试集,通过构建双分支网络架构(原型分支+邻域分支),引入任务自适应元学习机制,开发基于k近邻筛选的伪标签生成算法,采用交叉熵损失和对比损失联合优化特征空间。

研究结果:

  1. 动机验证:通过可视化分析证实单一原型在表征多模态分布类别时存在显著偏差,而邻域关系能有效捕捉局部数据结构。
  2. 模型设计:PNN通过可学习权重自动平衡原型距离(全局)与邻域投票(局部)的贡献,在5-way 1-shot任务中较基线PN提升9.2%。
  3. 任务自适应:插入的微调阶段使模型在novel类别上的特征可分性提高37%,尤其改善医学影像的跨域迁移效果。
  4. 伪标签生成:联合原型置信度与邻域一致性的筛选策略,将伪标签准确率从68%提升至89%,缓解了自训练中的确认偏差问题。

结论与意义:该研究通过原型与邻域的双重约束,首次实现复杂分布下小样本特征的紧致表征。提出的任务自适应机制为元学习框架提供新范式,而低噪声伪标签生成方法显著降低对标注数据的依赖。在COVID-19肺部CT等医疗场景的跨域测试中,PNN展现出强大的泛化能力,为医疗AI的落地应用提供技术支撑。未来可探索该框架在联邦学习场景下的扩展应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号