
-
生物通官微
陪你抓住生命科技
跳动的脉搏
随机引导网络(SGN):面向仿真到现实泛化的跨域语义分割新方法
【字体: 大 中 小 】 时间:2025年09月16日 来源:Neurocomputing 6.5
编辑推荐:
本文提出随机引导网络(SGN),通过类别重加权策略、多尺度特征融合引导(MSFFG)模块和多重风格扰动模块,有效解决合成数据与真实数据间的域差异问题。实验表明,SGN在Rain_Cityscapes和Foggy_Cityscapes数据集上mIoU分别提升3.86%和2.05%,在BDD100k等常规数据集平均提升1.48%,显著增强模型对未知数据的泛化能力。
Highlight
本研究提出的随机引导网络(SGN)创新性地整合了三大核心技术:
类别重加权策略:通过偏置校正机制缓解源域样本的类别不平衡(如GTAV数据集中头/尾类别样本量差异显著的问题),确保模型均衡学习各类别特征。
多尺度特征融合引导(MSFFG)模块:采用双路径架构融合跨层级特征,增强模型对域语义噪声的鲁棒性,有效抑制源域过拟合。
多重风格扰动模块:通过随机开关控制(阈值θ=0.35时激活),动态生成多样化数据风格,缩小合成数据与真实场景的域间隙。
Network Architecture
网络以ResNet-50为骨干编码器,输入图像xi经低层特征提取后,通过三个独立随机开关(P1, P2, P3)控制风格扰动流程。当Pk < θ时,触发对应模块生成域不变特征,显著提升在Cityscapes等真实场景中的分割精度。
Backbone Network
对比实验显示,SGN在ResNet-50(高精度模型)和MobileNetV2(轻量模型)上均表现优异,mIoU指标超越基线模型1.0%~3.86%,且训练成本大幅降低。
Dataset
采用GTAV合成数据集(24,966张图像,34类别)作为训练集,在BDD100k、Mapillary等真实数据测试中验证了方法的跨域适应性。
Conclusion
SGN在七大城市街景数据集上展现出卓越的Sim2Real泛化能力,尤其当训练集仅为GTAV时,性能较基线模型提升3.01%,为域广义语义分割(DGSS)提供了新范式。
生物通微信公众号
知名企业招聘