
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于频域显式去背景的织物缺陷检测方法研究:Swin-DBNet网络的多尺度特征增强与选择性注意力机制
【字体: 大 中 小 】 时间:2025年07月19日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
针对复杂背景下织物缺陷检测存在的干扰强、误检率高、鲁棒性不足等问题,研究人员提出了一种基于频域显式去背景(Explicit De-Background)的创新方法。通过Swin Transformer提取多尺度特征后,设计像素级去背景层(F-BEM+BSU)分离背景与缺陷特征,并结合去背景注意力模块(DBA)和特征交叉收缩解码器(FCSD)实现缺陷区域增强。实验表明,该方法在ZJU-Leaper和HKU-Fabric数据集上超越现有技术,为工业检测提供了高效解决方案。
纺织工业中,织物缺陷检测是保障产品质量的关键环节。尽管自动化技术逐步替代人工检测,但复杂背景纹理、光照变化以及微小缺陷的干扰,使得传统方法面临高误检率和漏检率的困境。现有基于深度学习的方法虽能学习全局特征,却难以显式区分背景与缺陷特征,导致检测性能受限。这一挑战激发了研究人员对仿生视觉感知技术的探索——正如人类视觉能快速分离目标与背景,如何让算法具备类似的“选择性注意力”成为突破口。
江苏省研究生科研与实践创新计划(KYCX25_3389)资助下,研究人员提出名为Swin-DBNet的创新网络。该工作发表于《Engineering Applications of Artificial Intelligence》,核心是通过频域显式建模模拟人类视觉的“整体感知(Gist Perception)”机制。网络首先利用Swin Transformer提取多尺度特征,随后通过频域背景提取模块(Frequency-domain Background Extraction Module, F-BEM)分析傅里叶振幅的全局一致性,捕捉背景纹理规律;背景抑制单元(Background Suppression Unit, BSU)则生成差异图来突出缺陷区域。去背景注意力模块(De-Background Attention, DBA)将差异图作为权重矩阵,动态调整特征空间中的缺陷聚焦程度。最后,特征交叉收缩解码器(Feature Cross-Shrinking Decoder, FCSD)通过跨层聚合节点(Cross Aggregation Nodes, CAN)实现多尺度特征的高效融合。
关键技术方法包括:1)Swin Transformer骨干网络提取层级特征;2)F-BEM基于傅里叶变换的振幅分析提取背景;3)BSU生成像素级差异图;4)DBA模块实现缺陷区域增强;5)FCSD解码器进行跨尺度特征融合。实验使用ZJU-Leaper和HKU-Fabric公开数据集验证性能。
主要研究结果
结论与意义
该研究首次将频域显式去背景与视觉注意力机制结合,其创新性体现在三方面:一是F-BEM/BSU通过傅里叶变换实现物理可解释的背景分离,突破了传统深度学习“黑箱”局限;二是DBA模块模拟人类视觉的选择性注意力,为复杂背景下的目标检测提供新范式;三是FCSD解码器通过层级收缩结构解决多尺度特征冗余问题。实际应用中,该方法在纺织工业质检系统部署后,将缺陷检测平均耗时从200ms/幅降至50ms/幅,准确率提升至98.6%。未来可扩展至半导体、光伏等领域的表面缺陷检测,为智能制造提供通用技术框架。
生物通微信公众号
知名企业招聘