基于不确定性与跨图像高斯混合模型的半监督语义分割伪标签优化方法UCGM

【字体: 时间:2025年07月23日 来源:Expert Systems with Applications 7.5

编辑推荐:

  为解决半监督语义分割中伪标签质量不高导致的模型性能受限问题,研究人员提出UCGM(Uncertainty and Cross-Image Gaussian Mixture Model)方法,通过不确定性加权和跨图像特征分布对齐优化伪标签。实验表明,该方法在PASCAL VOC 2012和Cityscapes数据集上显著提升分割精度,为减少标注依赖提供了新思路。

  

在计算机视觉领域,语义分割(Semantic Segmentation)作为像素级分类任务,是自动驾驶、医学影像分析等应用的核心技术。然而,获取海量像素级标注数据需要耗费巨大成本——仅标注一张Cityscapes数据集图像就需1.5小时人工。半监督学习(Semi-Supervised Learning)通过结合少量标注数据和大量未标注数据来缓解这一困境,但其核心挑战在于如何从模型预测中生成高质量的伪标签(Pseudo Labels)。现有方法如FixMatch和U2PL依赖置信度筛选,但高置信度区域仍存在错误预测,导致确认偏差(Confirmation Bias)。

针对这一难题,国内某研究机构的研究团队在《Expert Systems with Applications》发表研究,提出UCGM框架。该方法创新性地融合不确定性估计与跨图像高斯混合模型(Gaussian Mixture Model, GMM),通过双重机制优化伪标签:首先利用预测方差量化不确定性,为伪标签分配自适应权重;其次构建跨图像的类特征分布,通过标注数据的监督信息校正未标注数据的特征分布。关键技术包括可靠未标注像素正则化(RUPR)和交叉图像分布估计(CEGMM),并引入动态更新的记忆银行(Memory Bank)存储特征向量。

主要研究结果

  1. 不确定性引导的伪标签优化:通过Bootstrap采样计算预测方差,证明低方差区域错误率比高方差区域低62%,据此设计的权重分配策略使噪声标签占比降低37%。
  2. 跨图像特征分布对齐:在Cityscapes数据集上,利用标注数据构建的GMM组件将未标注数据的类间特征距离扩大2.3倍,使边界区域mIoU提升5.8%。
  3. 综合性能验证:在1/8标注比例下,UCGM在PASCAL VOC 2012达到75.3% mIoU,超越基线模型U2PL 4.2个百分点;在Cityscapes上对稀有类别(如交通标志)的识别精度提升尤为显著。

该研究通过理论创新与实验验证,首次实现将标注数据的特征分布先验知识迁移至未标注数据,突破了传统半监督学习仅依赖单图像置信度的局限。记忆银行的动态更新机制保障了特征表征的时效性,而不确定性加权策略为噪声标签处理提供了可解释的解决方案。这项工作不仅为减少语义分割的标注成本提供了实用工具,其跨图像分布对齐的思想对医学图像分析等小样本场景也具有重要借鉴意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号