
-
生物通官微
陪你抓住生命科技
跳动的脉搏
HFINet:基于异尺度特征整合的实时语义分割网络及其在复杂边界场景中的鲁棒性提升
【字体: 大 中 小 】 时间:2025年06月23日 来源:Signal Processing: Image Communication 3.4
编辑推荐:
针对语义分割中异尺度物体边界模糊和小目标漏分割问题,西安研究人员提出新型多分支网络HFINet。通过边界分支(Boundary Branch)整合空间完整性与通道显著性特征,结合高效聚合金字塔池化模块(EAPPM),在Cityscapes数据集实现78.0% mIoU/63.5FPS,较RCNet提升5.5%精度,为自动驾驶等场景提供精准分割方案。
在计算机视觉领域,语义分割(Semantic Segmentation)如同给图像中的每个像素"贴标签",是自动驾驶、医疗诊断等应用的核心技术。尽管全卷积网络(FCN)和双边网络(BiSeNet)等架构不断进步,但两个"顽疾"始终困扰研究者:一是小目标容易被大目标"吞噬",比如路灯杆在分割结果中变成模糊的色块;二是物体边缘总像被水晕染过,尤其当纤细的自行车辐条遇上宽大的车身时,算法常常"缴械投降"。这些问题的根源在于传统网络下采样时会丢失高频特征,而金字塔池化模块(PPM)又容易忽略微小结构。
针对这一挑战,西安的研究团队Jixiang Shi等人开发了HFINet网络,其创新点如同给算法装上"显微镜"和"裁剪刀"。通过新增的边界分支(Boundary Branch)与注意力边界感知优化模块(ABPRM),网络能同时捕捉交通标志的锐利边缘和远处行人的轮廓。该成果发表于《Signal Processing: Image Communication》,在1024×2048高分辨率图像上达到78.0% mIoU(平均交并比),速度达63.5帧/秒,比主流RCNet快7%且精度提升5.5%。
关键技术包括:1)多分支架构整合语义、细节和边界特征;2)ABPRM模块通过空间-通道双重视觉机制强化边缘;3)高效聚合金字塔池化模块(EAPPM)并行融合多尺度上下文特征;4)采用Cityscapes和CamVid数据集验证性能。
【网络架构】
HFINet采用语义分支、细节分支和边界分支的"三足鼎立"设计。其中边界分支像精密的手术刀,通过ABPRM模块的连续堆叠,将语义分支中的异尺度特征(Heteroscale Features)重新"缝合",特别关注空间信息的完整性和通道特征的重要性。
【边界优化】
ABPRM模块的创新在于同时计算空间完整性权重图和通道显著性向量。实验显示,该模块使电线杆等纤细物体的分割交并比提升12.3%,边界F1-score提高8.7%。
【上下文感知】
EAPPM突破传统PPM的串行结构,采用并行多尺度融合。在Cityscapes测试中,对远处小物体的识别准确率提升9.2%,证明其扩大感受野(Receptive Field)的有效性。
【损失函数】
联合使用边界损失(Boundary Loss)和语义损失,前者专门惩罚边缘模糊误差。消融实验表明,双损失组合使mIoU指标提升3.8个百分点。
这项研究的意义在于首次将边界特征提升到与语义特征同等重要的地位。就像画家既需要宽刷涂抹底色,也需要细笔勾勒轮廓,HFINet的边界分支让算法真正"看见"自行车辐条与手指的细微界限。团队特别指出,该方法在医疗影像中微小病灶分割方面具有潜在价值,例如区分血管壁与斑块边缘。未来工作将探索Transformer与边界分支的融合,进一步突破实时精度的极限。
生物通微信公众号
知名企业招聘