
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于不确定性与跨图像高斯混合模型的半监督语义分割伪标签优化方法UCGM
【字体: 大 中 小 】 时间:2025年07月23日 来源:Expert Systems with Applications 7.5
编辑推荐:
为解决半监督语义分割中伪标签质量不高导致的模型性能受限问题,研究人员提出UCGM(Uncertainty and Cross-Image Gaussian Mixture Model)方法,通过不确定性加权和跨图像特征分布对齐优化伪标签。实验表明,该方法在PASCAL VOC 2012和Cityscapes数据集上显著提升分割精度,为减少标注依赖提供了新思路。
在计算机视觉领域,语义分割(Semantic Segmentation)作为像素级分类任务,是自动驾驶、医学影像分析等应用的核心技术。然而,获取海量像素级标注数据需要耗费巨大成本——仅标注一张Cityscapes数据集图像就需1.5小时人工。半监督学习(Semi-Supervised Learning)通过结合少量标注数据和大量未标注数据来缓解这一困境,但其核心挑战在于如何从模型预测中生成高质量的伪标签(Pseudo Labels)。现有方法如FixMatch和U2PL依赖置信度筛选,但高置信度区域仍存在错误预测,导致确认偏差(Confirmation Bias)。
针对这一难题,国内某研究机构的研究团队在《Expert Systems with Applications》发表研究,提出UCGM框架。该方法创新性地融合不确定性估计与跨图像高斯混合模型(Gaussian Mixture Model, GMM),通过双重机制优化伪标签:首先利用预测方差量化不确定性,为伪标签分配自适应权重;其次构建跨图像的类特征分布,通过标注数据的监督信息校正未标注数据的特征分布。关键技术包括可靠未标注像素正则化(RUPR)和交叉图像分布估计(CEGMM),并引入动态更新的记忆银行(Memory Bank)存储特征向量。
主要研究结果
该研究通过理论创新与实验验证,首次实现将标注数据的特征分布先验知识迁移至未标注数据,突破了传统半监督学习仅依赖单图像置信度的局限。记忆银行的动态更新机制保障了特征表征的时效性,而不确定性加权策略为噪声标签处理提供了可解释的解决方案。这项工作不仅为减少语义分割的标注成本提供了实用工具,其跨图像分布对齐的思想对医学图像分析等小样本场景也具有重要借鉴意义。
生物通微信公众号
知名企业招聘