
-
生物通官微
陪你抓住生命科技
跳动的脉搏
UASeg:面向自动驾驶场景的基于不确定性感知弱监督语义分割创新框架
【字体: 大 中 小 】 时间:2025年06月17日 来源:Expert Systems with Applications 7.5
编辑推荐:
为解决自动驾驶场景中复杂空间关系、显著尺度变化和严重类别不平衡带来的弱监督语义分割(WSSS)性能瓶颈,研究人员提出UASeg框架。该研究通过上下文自适应解码器(CAD)和多尺度不确定性感知自适应训练(MUAT)两大创新模块,在Cityscapes等数据集实现最先进性能,显著提升小目标及边界分割精度,为降低自动驾驶系统标注成本提供新思路。
自动驾驶技术的快速发展对高精度环境感知提出迫切需求,其中语义分割作为像素级场景理解的核心技术,其性能直接影响车辆决策安全性。然而,现有方法面临一个关键矛盾:全监督学习需要大量精细标注,而弱监督语义分割(WSSS)在复杂驾驶场景中表现欠佳。城市道路环境中,交通灯、行人等小尺度安全关键目标常被道路、建筑等主导类别淹没,加之动态遮挡和极端尺度变化,传统WSSS方法如基于类激活图(CAM)或CLIP的框架往往产生模糊边界和漏检问题。
针对这一挑战,研究人员开发了UASeg创新框架。该研究通过两个核心技术突破现有局限:上下文自适应解码器(CAD)采用动态特征处理机制,根据局部场景复杂度自适应调整注意力与卷积操作;多尺度不确定性感知自适应训练(MUAT)则通过不确定性引导的损失函数和分层特征融合,有效缓解类别不平衡问题。在Cityscapes、CamVid和WildDash2数据集上的系统验证表明,该方法在摩托车、交通标志等小目标类别上实现超过5%的mIoU提升。
关键技术方法包括:1) 构建动态路由的CAD模块,通过门控机制选择卷积或注意力路径;2) 设计MUAT训练策略,整合多尺度特征金字塔与不确定性估计模块;3) 采用来自Cityscapes等数据集的2975张训练图像,建立基于图像级标签的弱监督学习范式。
【Context Adaptive Decoder】
CAD模块创新性地引入场景复杂度感知机制,通过可学习阈值将特征图划分为简单/复杂区域,分别采用卷积核注意力并行处理。实验显示该设计使小目标召回率提升12.3%,尤其在20像素以下物体表现突出。
【Multi-Scale Uncertainty-Aware Adaptive Training】
MUAT策略通过构建三级特征金字塔,在4×、8×、16×三个尺度计算不确定性权重。消融实验证实,该模块使稀有类别(如交通灯)的F1-score从0.48提升至0.61,显著缓解类别不平衡问题。
【跨数据集验证】
在WildDash2极端天气数据测试中,UASeg保持73.2%的稳定mIoU,较基线CLIP-ES方法提高9.8个百分点,证明其强泛化能力。可视化分析显示,该方法在雨雾条件下仍能准确识别80%以上的小型交通标志。
研究结论表明,UASeg通过将动态架构设计与不确定性学习相结合,首次在弱监督条件下实现接近全监督方法85%的性能。该成果不仅为自动驾驶提供经济高效的标注方案,其CAD模块的动态路由思想更为医学影像分割等跨领域应用提供新范式。讨论部分指出,未来工作可探索时序信息融合以进一步提升视频序列分割的连续性,这对实际驾驶系统的部署具有重要实践价值。
生物通微信公众号
知名企业招聘