多分支强扰动约束学习框架在半监督语义分割中的创新应用

【字体: 时间:2025年07月28日 来源:Pattern Recognition 7.5

编辑推荐:

  推荐:针对半监督语义分割(SSS)中单模态扰动策略的局限性,研究人员提出多分支强扰动约束学习框架(MSPL-CSSL),通过多级扰动增强和分层一致性学习,在PASCAL VOC 2012等数据集上实现SOTA性能,显著提升细粒度边界分割精度。

  

在计算机视觉领域,语义分割(semantic segmentation)作为像素级分类任务,对自动驾驶和医学影像分析至关重要。然而,获取像素级标注数据成本高昂,尤其在医疗等专业领域。半监督语义分割(SSS)通过利用少量标注数据和大量未标注数据缓解这一难题,其中基于一致性学习(consistency learning)的方法通过数据扰动增强模型鲁棒性。然而现有方法存在三大痛点:单模态数据增强(single-mode data augmentation)限制扰动空间探索、强扰动导致训练不稳定、弱到强(weak-to-strong)伪监督在细粒度区域易产生误差累积。

针对这些挑战,浙江理工大学的研究团队在《Pattern Recognition》发表创新研究,提出多分支强扰动约束学习框架(Multi-branch Strong Perturbation Constraint Learning)。该工作通过多分支扰动学习策略(MSPL)构建区域混合(region mixing)、迭代遮挡(iterative occlusion)和脉冲噪声注入(impulse noise injection)三级级联扰动,并设计约束模拟监督损失(CSSL)实现弱到强(weak-to-strong)与强到强(strong-to-strong)的双重一致性约束。实验表明该方法在PASCAL VOC 2012等三大基准数据集上达到最先进水平,特别在物体边缘分割精度提升显著。

关键技术方法包括:1) 多分支架构并行处理弱数据增强(WDA)和三种强数据增强(SDA);2) 分层一致性学习结构,同时约束弱-强分支和强-强分支预测;3) 基于PASCAL VOC 2012等数据集的1/16~1/4标注比例半监督实验设置;4) 区域混合、迭代遮挡和噪声注入的多级扰动策略。

【多分支强扰动约束学习】通过三个强扰动分支扩展传统单分支框架,其中区域混合增强全局语义多样性,迭代遮挡(每次随机遮挡5-15%区域)提升边界敏感性,脉冲噪声(密度0.1-0.3)增强噪声鲁棒性。实验显示该设计使mIoU在1/16 VOC标注下提升4.3%。

【约束模拟监督损失】创新性地引入强分支间一致性约束,通过KL散度衡量不同强扰动预测差异。消融实验证明该损失使训练稳定性提升27%,边界区域F1-score提高5.8%。

【基准测试结果】在Cityscapes数据集1/8标注设定下达到68.9% mIoU,超越同期最佳方法3.1%;对小物体(面积<322像素)的检测召回率提升9.2%,证实方法对细粒度分割的有效性。

该研究突破了传统SSS方法的扰动空间限制,通过多分支协同学习和双重约束机制,为解决标注数据稀缺条件下的精细分割提供了新思路。CSSL的稳定性设计尤其适用于医疗影像等对边界精度要求高的场景,而MSPL的多级扰动策略为自动驾驶中的复杂环境理解提供了更鲁棒的解决方案。作者在讨论中指出,未来可探索动态扰动权重调整和三维医学影像的扩展应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号