
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Unit Attention Deeplabv3+的非结构化道路可行驶区域高精度语义分割方法研究
【字体: 大 中 小 】 时间:2025年06月18日 来源:Computer Vision and Image Understanding 4.3
编辑推荐:
为解决非结构化道路可行驶区域检测中边界模糊、环境干扰等问题,研究人员提出融合Unit Attention Module的DeepLabv3+网络(UAD),通过双注意力与空间注意力机制增强语义信息加权,在印度驾驶数据集上实现85.99% mIoU和92.01%像素精度,为自动驾驶路径规划提供高鲁棒性分割方案。
自动驾驶技术的快速发展对复杂道路环境的感知能力提出了更高要求。在非结构化道路(如乡村土路、无标线支路)场景中,可行驶区域检测面临边界模糊、纹理复杂、动态干扰等挑战。传统方法依赖阈值分割(Prewitt and Mendelsohn, 1966)、边缘检测(Canny, 1986)或几何特征(Le et al., 2014),但难以应对光照变化和异质环境。尽管DeepLabv3+等深度学习网络展现出优势,仍存在参数量大、细节处理不足等问题。
针对这一技术瓶颈,研究人员创新性地提出Unit Attention Deeplabv3+(UAD)网络。该研究采用MobileNetv2作为骨干网络降低计算负载,在编码器端的Atrous Spatial Pyramid Pooling(ASPP,空洞空间金字塔池化)模块后嵌入Unit Attention Module,通过双注意力机制(通道+空间)动态增强关键特征权重。在印度驾驶数据集(IDD)的测试中,UAD以85.99%的平均交并比(mIoU)和92.01%的像素精度显著超越基线模型,尤其提升了泥地、砾石等复杂路况的边缘分割效果。
关键技术包括:1)基于MobileNetv2轻量化的DeepLabv3+架构;2)融合双注意力与空间注意力的Unit Attention Module;3)使用IDD数据集(包含10000张印度非结构化道路图像)进行模型训练与验证;4)采用PyTorch框架与CUDA加速,配置0.01学习率与0.0001权重衰减。
Proposed method
研究通过改进DeepLabv3+网络结构,在ASPP模块后引入Unit Attention Module。该模块先通过通道注意力筛选重要特征通道,再利用空间注意力强化边缘区域特征响应,最终通过1×1卷积实现特征融合。实验表明,该设计使模型在保持83 FPS实时性的同时,较原网络提升2.3% mIoU。
Choice of targeted dataset
选用IDD数据集而非Cityscapes,因其包含更多无标线道路、动态障碍物等非结构化场景,覆盖阴影、水渍等干扰因素,更贴合实际自动驾驶需求。
Network parameters
在NVIDIA RTX 4060 GPU上,UAD网络训练批次设为3,采用交叉熵损失函数。消融实验证实,Unit Attention Module使草地、沙土等异质路面的分割交并比提升4.7%。
Conclusion
该研究通过注意力机制与轻量化设计的协同优化,实现了非结构化道路场景下精度与效率的平衡。其创新点在于:1)提出Unit Attention Module增强边缘细节处理;2)验证MobileNetv2骨干网络在复杂道路分割中的适用性;3)为自动驾驶系统提供高鲁棒性的实时分割方案。未来可探索多模态传感器融合进一步提升夜间或极端天气下的性能。
生物通微信公众号
知名企业招聘