基于频域显式去背景的织物缺陷检测方法研究:Swin-DBNet网络的多尺度特征增强与选择性注意力机制

【字体: 时间:2025年07月19日 来源:Engineering Applications of Artificial Intelligence 7.5

编辑推荐:

  针对复杂背景下织物缺陷检测存在的干扰强、误检率高、鲁棒性不足等问题,研究人员提出了一种基于频域显式去背景(Explicit De-Background)的创新方法。通过Swin Transformer提取多尺度特征后,设计像素级去背景层(F-BEM+BSU)分离背景与缺陷特征,并结合去背景注意力模块(DBA)和特征交叉收缩解码器(FCSD)实现缺陷区域增强。实验表明,该方法在ZJU-Leaper和HKU-Fabric数据集上超越现有技术,为工业检测提供了高效解决方案。

  

纺织工业中,织物缺陷检测是保障产品质量的关键环节。尽管自动化技术逐步替代人工检测,但复杂背景纹理、光照变化以及微小缺陷的干扰,使得传统方法面临高误检率和漏检率的困境。现有基于深度学习的方法虽能学习全局特征,却难以显式区分背景与缺陷特征,导致检测性能受限。这一挑战激发了研究人员对仿生视觉感知技术的探索——正如人类视觉能快速分离目标与背景,如何让算法具备类似的“选择性注意力”成为突破口。

江苏省研究生科研与实践创新计划(KYCX25_3389)资助下,研究人员提出名为Swin-DBNet的创新网络。该工作发表于《Engineering Applications of Artificial Intelligence》,核心是通过频域显式建模模拟人类视觉的“整体感知(Gist Perception)”机制。网络首先利用Swin Transformer提取多尺度特征,随后通过频域背景提取模块(Frequency-domain Background Extraction Module, F-BEM)分析傅里叶振幅的全局一致性,捕捉背景纹理规律;背景抑制单元(Background Suppression Unit, BSU)则生成差异图来突出缺陷区域。去背景注意力模块(De-Background Attention, DBA)将差异图作为权重矩阵,动态调整特征空间中的缺陷聚焦程度。最后,特征交叉收缩解码器(Feature Cross-Shrinking Decoder, FCSD)通过跨层聚合节点(Cross Aggregation Nodes, CAN)实现多尺度特征的高效融合。

关键技术方法包括:1)Swin Transformer骨干网络提取层级特征;2)F-BEM基于傅里叶变换的振幅分析提取背景;3)BSU生成像素级差异图;4)DBA模块实现缺陷区域增强;5)FCSD解码器进行跨尺度特征融合。实验使用ZJU-Leaper和HKU-Fabric公开数据集验证性能。

主要研究结果

  1. 显式去背景层的有效性:F-BEM通过频域振幅建模成功捕捉织物背景的周期性纹理,BSU将背景特征抑制后,差异图使缺陷区域的信噪比提升2.3倍。
  2. DBA的注意力机制优势:相比传统空间注意力,DBA模块在复杂背景下的缺陷召回率提高12.7%,误检率降低9.4%。
  3. 多尺度特征融合性能:FCSD通过金字塔收缩策略减少28%的特征冗余,跨层聚合节点(CAN)使小缺陷检测F1-score提升15.2%。
  4. 跨数据集泛化能力:在HKU-Fabric迁移任务中,Swin-DBNet的mAP达89.3%,显著优于对比模型。

结论与意义
该研究首次将频域显式去背景与视觉注意力机制结合,其创新性体现在三方面:一是F-BEM/BSU通过傅里叶变换实现物理可解释的背景分离,突破了传统深度学习“黑箱”局限;二是DBA模块模拟人类视觉的选择性注意力,为复杂背景下的目标检测提供新范式;三是FCSD解码器通过层级收缩结构解决多尺度特征冗余问题。实际应用中,该方法在纺织工业质检系统部署后,将缺陷检测平均耗时从200ms/幅降至50ms/幅,准确率提升至98.6%。未来可扩展至半导体、光伏等领域的表面缺陷检测,为智能制造提供通用技术框架。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号