面向密集场景的多尺度轮廓特征增强行人检测模型EDPDet研究
【字体:
大
中
小
】
时间:2025年10月07日
来源:Exploratory Research in Clinical and Social Pharmacy 1.8
编辑推荐:
本文提出高效密集行人检测器EDPDet,通过多尺度轮廓特征增强模块(MCFEM)和高效跨尺度路径聚合网络(ECPAN)提升复杂背景下的行人识别能力,并结合非极大值抑制自由(NMS-free)策略实现端到端部署。在CrowdHuman和WiderPerson数据集上分别达到91.4%和92.5% AP,显著优于现有方法。
针对行人检测任务中的难点,已有多种方法被提出。自适应非极大值抑制(Adaptive NMS)可根据行人目标分布密度动态调整NMS阈值,对拥挤场景更为友好。类似地,OTP-NMS基于可见性比率和分类分数为每个行人预测最优NMS阈值。R2NMS利用受遮挡影响较小的可见部位提升检测鲁棒性。
图1展示了EDPDet的整体架构,包含主干网络(backbone)、颈部网络(neck)和检测头(head)三部分。主干网络由多尺度轮廓特征增强模块(MCFEM)、卷积-批归一化-激活模块(CBS)、快速空间金字塔池化(SPPF)和C2PSA组成。MCFEM具备多尺度特征提取和轮廓增强能力,CBS包含卷积层、批归一化层和Sigmoid线性单元函数,SPPF通过串联不同尺度的池化特征逐步扩大感受野。
CrowdHuman是由Megvii发布的大规模行人检测数据集,包含15,000张训练图像、4,370张验证图像和5,000张测试图像,标注涵盖全身边界框、可见区域及头部位置,适用于密集场景和遮挡研究。WiderPerson是另一重要基准数据集,包含12,000张图像和约40,000个标注实例,场景多样且标注包括可见区域。VisDrone为无人机视角数据集,包含10,209张图像,涵盖多尺度目标及复杂环境挑战。
本研究提出的EDPDet适用于以行人为主的关键类别检测任务。通过MCFEM增强网络对多尺度行人目标的感知能力,并结合ECPAN提升跨尺度特征融合效率,尤其优化了小目标检测性能。实验表明该方法在多个数据集上均达到先进水平。
CRediT authorship contribution statement
Yangxi Yu: 概念化、方法论、资源、软件、可视化、验证、初稿撰写与修订。
Wentao Lyu: 概念化、资金获取、资源、修订。
Declaration of competing interest
作者声明不存在可能影响本研究的财务利益或个人关系冲突。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号