基于双倒残差块混合聚合策略的轻量化显著目标检测模型HASNet:平衡效率与精度的新突破

【字体: 时间:2025年09月13日 来源:Neural Networks 6.3

编辑推荐:

  本综述提出了一种创新的轻量化显著目标检测(SOD)模型HASNet,通过混合编码器架构结合卷积神经网络(CNN)与Transformer优势,设计全局倒残差块(GIRB)和轻量倒残差块(LIRB)实现跨架构特征深度聚合,显著提升模型效率与检测精度,为移动端视觉应用提供新解决方案。

  

Highlight亮点

  • 我们提出名为HAS的混合特征聚合策略,通过分组处理不同架构特征并实施浅层与深层聚合,高效整合跨层级信息。

  • 针对Transformer特征设计全局倒残差块(GIRB),引入高效全局操作增强通道语义捕获能力;针对CNN特征设计轻量倒残差块(LIRB),通过扩展与收缩阶段替代线性变换,大幅降低参数量与计算成本。

  • 大量实验表明,融合CNN与Transformer优势的HASNet在五个数据集上定量与定性评估均超越现有SOTA方法。

Heavyweight salient object detection 重量级显著目标检测

SOD任务旨在提取图像中最吸引人的区域。通常采用大量参数的卷积(如ResNet)或Transformer(如ViT)架构作为主干网络的方法称为重量级SOD。

Overview 模型概述

HASNet整体架构如图3所示。输入256×256图像经MobileViT主干编码获得五层多尺度特征X1~5。前两层为纯CNN架构特征(富含空间几何信息),后三层为纯Transformer架构特征(蕴含全局语义信息)。

Datasets 数据集

我们在五大权威SOD数据集评估模型:DUTS(10,553训练图/5,019测试图)、ECSSD(1,000图)、HKU-IS(4,447图)、PASCAL-S(850图)和DUT-OMRON(5,168图)。遵循主流设定,使用DUTS训练集训练模型。

Limitations 局限性

尽管本方法实现了高效高精度,仍有改进空间。例如:Transformer架构的FPS仍低于CNN,可通过优化Transformer实现提升;某些特定场景(如背景色过突出)会导致检测失败(图12示例)。

Conclusion 结论

本文设计了一种基于混合架构的轻量化SOD网络。通过混合聚合策略(HAS)结合LIRB与GIRB模块,在扩展与收缩阶段优化IRB中的1×1卷积,显著降低计算与存储资源消耗。GIRB引入高效全局操作增强Transformer特征处理能力。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号