
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于对齐特征金字塔网络(AFPN)的实时语义分割算法研究:融合空间与语义信息的新策略
【字体: 大 中 小 】 时间:2025年06月28日 来源:Pattern Recognition 7.5
编辑推荐:
针对现有语义分割算法在融合多尺度特征时存在信息丢失和语义鸿沟的问题,研究人员提出对齐特征金字塔网络(AFPN),通过池化增强注意力块(PEAB)和双池化对齐块(DPAB)实现低层空间信息与高层语义信息的有效对齐。实验表明,AFPN在Cityscapes等数据集上达到78.75% mIoU,兼顾实时性与精度,为自动驾驶等场景提供新解决方案。
语义分割是计算机视觉领域的核心任务之一,其目标是为图像中的每个像素分配语义标签,广泛应用于自动驾驶、遥感分析和医学影像等领域。然而,现有方法在平衡精度与速度方面面临严峻挑战。传统全卷积网络(FCN)通过下采样扩大感受野,但导致空间信息丢失;而双路径结构(如BiSeNet)虽保留浅层细节,却因简单融合引发冗余。此外,特征金字塔网络(FPN)虽能整合多尺度特征,但忽略层级间的语义差异。如何高效融合空间与语义信息,成为突破实时语义分割瓶颈的关键。
针对这一问题,来自中国的科研团队在《Pattern Recognition》发表研究,提出对齐特征金字塔网络(AFPN)。该网络创新性地结合双路径结构与FPN优势,通过特征提取、注入和对齐三阶段流程,实现低层空间信息与高层语义信息的动态平衡。关键技术包括:1)池化增强注意力块(PEAB),利用聚合池化强化轴向注意力,提取全局语义信息;2)双池化对齐块(DPAB),通过通道与空间维度的双重池化操作缩小多尺度特征差异。实验采用Cityscapes、CamVid和ADE20K数据集验证性能。
研究结果
Pooling Enhancement Attention Block (PEAB)
PEAB通过轴向注意力机制与池化操作增强特征表征。实验表明,该模块能有效捕获长程依赖关系,减少局部细节损失,在Cityscapes数据集上使mIoU提升2.3%。
Dual Pooling Alignment Block (DPAB)
DPAB采用通道池化和空间池化并行策略,显著降低浅层(空间)与深层(语义)特征间的差异。消融实验显示,DPAB使跨层级特征对齐误差减少37%,推理速度达45 FPS。
整体性能对比
AFPN在512×1024分辨率下,于Cityscapes、CamVid和ADE20K数据集分别取得78.75%、79.24%和39.56% mIoU,参数量仅3.8M,显著优于BiSeNetV2和S2FPN等基线模型。
结论与意义
AFPN通过PEAB和DPAB的协同设计,首次实现双路径结构与FPN的优势互补,为实时语义分割提供新范式。其创新点在于:1)以池化操作强化注意力机制,解决传统轴向注意力(Axial Attention)的局部信息丢失问题;2)通过双维度池化实现跨层级特征对齐,突破多尺度融合的语义鸿沟限制。该研究不仅推动语义分割技术的实用化进程,也为遥感、医疗等领域的精细化图像分析奠定基础。未来工作可探索轻量化设计以适配移动端设备。
(注:全文依据原文内容提炼,未添加非原文信息;技术术语如mIoU(mean Intersection over Union)、FPN(Feature Pyramid Network)等均保留原文表述及格式。)
生物通微信公众号
知名企业招聘