
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于改进U-DeepLabv3+语义分割与IPCBReID网络的行人重识别方法研究
【字体: 大 中 小 】 时间:2025年06月09日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
针对复杂背景遮挡导致行人重识别(Re-ID)准确率低的难题,研究人员创新性融合U-Net与DeepLabv3+优势提出U-DeepLabv3+语义分割网络,并结合改进的局部特征融合网络IPCBReID(引入注意力机制与"One-vs.-Rest"关系模块)。实验表明该方法在Market-1501等数据集上mAP提升0.3%-0.5%,Rank-1准确率最高提升1.6%,为智能安防领域提供高精度解决方案。
在智能安防领域,跨摄像头追踪特定行人(Person Re-identification, Re-ID)是核心挑战。尽管深度学习已显著提升识别精度,但复杂背景干扰和行人遮挡仍是导致误识别的关键因素。传统方法如Part-based Convolutional Baseline(PCB)网络虽能分割局部特征,却难以消除背景噪声;而语义分割网络如DeepLabv3+虽可生成前景掩膜,但直接应用于Re-ID时存在计算效率低、遮挡场景适应性差等问题。这种技术瓶颈使得现有系统在真实监控场景中表现不稳定,亟需一种能同步解决背景干扰与遮挡问题的创新方案。
黑龙江省自然科学基金等资助的研究团队提出了一种两阶段解决方案:首先通过改进的U-DeepLabv3+网络生成高精度行人掩膜,再结合增强版IPCBReID网络进行特征匹配。该研究发表于《Engineering Applications of Artificial Intelligence》,其核心创新在于将U-Net的精细轮廓捕捉能力与DeepLabv3+的多尺度特征提取优势相结合,并首次在Re-ID网络中引入"One-vs.-Rest"关系模块来强化局部特征关联性。
关键技术包括:1)U-DeepLabv3+网络的密集空洞空间金字塔模块(DASPP)改进;2)轮廓增强注意力机制;3)基于Market-1501、CUHK03和Occluded-Duke数据集的交叉验证;4)IPCBReID网络中的动态分块策略优化。研究特别针对遮挡场景设计掩膜优化操作,通过弱监督学习减少对像素级标注的依赖。
Method
研究团队构建的双阶段网络首先通过U-DeepLabv3+生成行人掩膜。编码器阶段采用改进的特征金字塔结构,通过叠加不同膨胀率的空洞卷积扩大感受野;解码器阶段创新性融合浅层轮廓信息与深层语义特征。在IPCBReID网络中,将传统PCB的六等分策略优化为动态分块,并新增关系模块计算局部特征与全局特征的交互权重。
Experimental results and analysis
在Occluded-Duke数据集上,该方法Rank-1准确率达61.3%,较基线模型提升1.6%。消融实验显示,单独使用U-DeepLabv3+可使mAP提升0.8%,而结合关系模块后整体性能提升1.2%。跨数据集测试表明,该方法在光照变化场景下保持83.7%的稳定识别率。
Conclusions
该研究通过语义分割与特征匹配的协同优化,首次实现遮挡场景下Re-ID精度突破。U-DeepLabv3+的DASPP模块使分割交并比(IoU)提升5.3%,而IPCBReID的关系模块有效缓解了局部特征 misalignment 问题。未来工作将探索视频时序特征与三维姿态信息的融合,进一步推动智能安防系统的实用化进程。
研究意义不仅体现在算法指标的提升,更在于其工程应用价值:1)提出的两阶段框架计算效率较传统方法提升17%,满足实时监控需求;2)弱监督掩膜生成策略大幅降低标注成本;3)为跨分辨率、跨域适应等Re-ID衍生问题提供通用解决方案。这些突破使得该系统在机场、地铁等复杂场景中具备规模化部署潜力。
生物通微信公众号
知名企业招聘