基于结构化涂鸦标注的弱监督显著性目标检测框架研究

【字体: 时间:2025年07月25日 来源:Neurocomputing 5.5

编辑推荐:

  为解决弱监督显著性目标检测(WSOD)中涂鸦标注结构信息缺失问题,研究人员提出结构化涂鸦标注方法,设计包含多尺度连接模块(MCM)、细节挖掘模块(DMM)和结构引导模块(SGM)的新型学习框架,实验表明该方法性能超越现有弱监督方法并接近全监督水平。

  

在计算机视觉领域,显著性目标检测(Salient Object Detection, SOD)如同给机器安装"视觉焦点选择器",能自动识别图像中最吸引人的物体。然而现有全监督方法依赖费时费力的像素级标注,而弱监督方法中常用的涂鸦标注又存在结构信息缺失问题——就像仅画出人体轮廓却漏掉骨骼关节,导致模型预测时出现"断肢残臂"的现象。

针对这一挑战,东北大学的研究团队在《Neurocomputing》发表创新成果。他们首次将蕴含物体骨架特征的结构化涂鸦引入弱监督显著性检测(WSOD)领域,就像给简笔画添上关键骨架线条。基于此开发的Structure-Enhanced Network(SENet)框架包含三大核心技术:多尺度连接模块(MCM)像搭建多级信息桥梁,通过跨层特征筛选增强结构恢复能力;细节挖掘模块(DMM)采用双流注意力机制,如同考古学家用精细刷子清理特征噪声;结构引导模块(SGM)则像专业调色师,通过"融合-增强-选择"策略完美平衡结构与细节特征。特别设计的比例数据增强(PDA)策略,通过随机采样不同长宽比的训练图像,有效缓解了常规正方形裁剪导致的特征形变问题。

研究结果显示,在S2-DUTS数据集上的实验验证了结构化涂鸦的优越性。MCM模块通过金字塔池化与门控机制,显著提升了小尺度特征的利用率;DMM模块中并行的空间/通道注意力流,使细节特征提取精度提升23%;SGM模块通过三级特征处理,在ECSSD数据集上达到0.891的F-measure值。与16种先进方法对比,该框架在DUT-OMRON等5个基准数据集上MAE平均降低0.015,部分指标甚至超越全监督方法。

这项研究的突破性在于:从数据标注源头创新,用仅增加10%标注时间的结构化涂鸦解决了WSOD领域长期存在的结构缺失痛点;提出的PDA策略为图像处理领域输入形变问题提供了通用解决方案;整套方法在工业级显卡上可实现25FPS实时检测,为移动端应用铺平道路。正如论文通讯作者所言:"这就像用速写画的效率,达到了工笔画的精度"。未来该技术可拓展至医学图像分割、自动驾驶场景理解等领域,其开源代码已发布在GitHub平台供学界验证。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号