基于邻域感知特征增强网络(NAFENet)的人群计数方法研究

【字体: 时间:2025年05月27日 来源:Image and Vision Computing 4.2

编辑推荐:

  为解决人群计数中因通道间和像素间关系利用不足导致的特征表征受限问题,研究人员提出Neighbor-Aware Feature Enhancement Network (NAFENet),通过跨通道注意力模块(ACAM)、通道残差模块(CRM)和空间相关性模块(SCM)增强特征表达。实验表明,该方法在6个数据集上性能优于现有模型,且计算效率更高,为智能城市安防管理提供了新思路。

  

在智能城市建设和公共安全领域,准确估计拥挤场景中的人群数量至关重要。然而,现有基于深度学习的密度图方法常因忽略通道间(inter-channel)和像素间(inter-pixel)的关联性,导致特征表征不充分。尤其当面对复杂背景干扰或密集人群时,模型易丢失细粒度细节,影响计数精度。尽管注意力机制通过权重分配提升了关键特征响应,但传统方法往往孤立处理单个通道或局部区域,未能充分挖掘相邻通道的协同效应和长程像素依赖关系。

针对这一瓶颈,陕西师范大学等机构的研究团队在《Image and Vision Computing》发表论文,提出创新性解决方案——邻域感知特征增强网络(NAFENet)。该网络通过三个核心模块实现突破:跨通道注意力模块(ACAM)量化相邻通道影响力并提取互补信息;通道残差模块(CRM)学习通道间残差映射以捕捉细微差异;空间相关性模块(SCM)建模行间像素长程依赖,有效解析连续结构。实验证明,NAFENet在六个挑战性数据集上均达到最优性能,且计算复杂度显著低于对比模型。

关键技术方法包括:1) 采用特征提取模块(FEM)获取初始特征;2) 通过ACAM生成通道相关性图,加权融合邻域通道特征;3) 利用CRM学习通道间残差,增强细节捕捉能力;4) 设计SCM建立行间像素关联,提升长程结构分析;5) 使用多尺度密度图回归头实现端到端训练。数据来源于主流人群计数数据集如ShanghaiTech和UCF-QNRF。

Related work
研究将现有方法归纳为四类:基于定位、密度图、注意力机制和Transformer的方法,指出多尺度网络和注意力机制的局限性,为NAFENet的设计提供理论依据。

Proposed method
NAFENet架构包含FEM、ACAM、CRM和SCM。ACAM通过三维卷积计算通道相关性权重,CRM采用残差学习捕捉通道差异,SCM使用水平条纹池化建模行间关联。算法1详细说明前向传播流程。

Implementation details
采用几何自适应核生成密度图真值,Adam优化器训练,使用平均绝对误差(MAE)和均方误差(MSE)作为评估指标。数据增强策略包括随机裁剪和翻转。

Experiments
在ShanghaiTech PartA上MAE降至54.3,优于对比模型12.7%。消融实验验证各模块贡献:SCM对遮挡场景提升显著(MAE降低9.2%),ACAM+CRM组合使背景干扰误差下降15.6%。复杂度分析显示参数量仅增加3.8%但推理速度提升22%。

Conclusion
NAFENet通过显式建模通道和空间邻域关系,实现了人群计数领域的三大突破:1) ACAM首次将通道邻域交互量化为可学习权重;2) CRM通过残差学习揭示通道间隐含差异;3) SCM创新性地建立行间像素语义关联。该方法为高密度场景分析提供了新范式,其轻量化设计尤其适合实时安防系统。未来可扩展至车辆计数等连续结构识别任务。

研究得到国家自然科学基金(61675161、62275211)和陕西省重点研发计划(2023-ZDLGY-22)资助,所有作者声明无利益冲突。论文通过严格的统计显著性检验(p<0.01),失败案例分析表明极端光照条件仍是主要挑战。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号