基于特征选择和集成技术的钢材缺陷检测

《Engineering Applications of Artificial Intelligence》:Steel defect detection based on feature selection and ensemble technique

【字体: 时间:2026年02月05日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  表面缺陷检测与集成学习优化在钢制造中的应用

  
Akhilesh Kumar Singh | Koushlendra Kumar Singh | Mrityunjay Kumar Singh | Biswajit Ghosh | G.R. Dinesh Kumar | Rajesh Shyam Pais | Vivek Sharma
机器视觉与智能实验室,计算机科学与工程系,NIT Jamshedpur,Adityapur,Jamshedpur,831014,Jharkhand,印度

摘要

准确且及时的表面缺陷检测对于确保钢铁产品的质量和表面完整性至关重要,因为这可以节省制造成本并防止产品被拒收。在工业环境中,这项任务更具挑战性,原因是特征空间维度较高、缺陷数据中的类别不平衡现象严重以及存在缺失值。本研究提出了一种全面的集成学习框架,用于预测钢铁表面缺陷,主要关注用于制造汽车车身板的无缺陷镀锌(GA)和镀锌钢表面。所提出的方法通过结合一种新颖的多视图插补和特征编码(MVIFE)技术与基于最大信息系数(MIC)的特征重要性排序来提高数据质量和判别性特征表示。MVIFE使用贝叶斯岭回归进行迭代多变量插补,按特征过滤缺失值,并存储分类特征。这使得它成为处理不准确工业数据的强大工具。为了识别与目标变量具有线性和非线性依赖关系的相关参数,使用了MIC分数。一种结合了Bagging、Boosting、Blending和Max Voting的集成分类架构在修改后的特征集上运行。来自塔塔钢铁数据库的真实世界钢铁缺陷数据集(该数据集类别极不平衡)表明,所提出的方法是有效的。我们应用了合成少数样本过采样技术(SMOTE)来解决类别不平衡问题,并使用准确性、精确度、召回率和F1分数来评估模型性能。根据实验数据,所提出的集成框架始终优于单一学习模型。Blending获得了最佳的总体F1分数,Max Voting获得了更高的召回率,而Blending则获得了更好的准确性。这些结果表明,所建议的方法对于准确预测钢铁表面的缺陷非常有用且可靠。

引言

在汽车行业中,由于对车身板有严格的质量要求,钢铁表面的质量对于判断制造物品的结构完整性、美观性和市场竞争力非常重要。划痕、裂纹、夹杂物和其他表面缺陷会大大降低产品的性能,通常导致产品被拒收、返工或造成经济损失。及早和准确地识别这些缺陷对于降低制造成本、减少材料浪费以及保证产品质量的一致性至关重要(Ma等人,2021年)。经过镀锌处理的钢铁可以防止生锈和腐蚀。最常见的镀锌方法是热浸镀锌和电镀锌。镀锌的主要目的是延长钢铁的使用寿命和耐用性,使其能够在建筑、汽车制造和白色家电生产等恶劣环境中使用(Kim等人,2021年)。镀锌钢被用于汽车行业和白色家电中,这些领域对表面质量有很高的要求。连续镀锌工艺是一种生产镀锌钢的方法。该工艺首先清洁钢铁表面以去除污垢,然后将其放入退火炉中以达到所需的机械性能,最后将其浸入熔融锌浴中进行涂层处理。这一过程涉及许多影响表面质量的参数,而汽车车身板对无缺陷的要求非常严格。然而,由于客户需求的不断增加,生产大量无缺陷的镀锌(GA)和镀锌(GI)表面仍然具有挑战性。在连续镀锌生产线中,由于工艺条件的异常,可能会出现缺陷。未涂层的点缺陷会破坏金属涂层的白色外观,如图1所示。这种未涂层的点在卷材中是不可接受的缺陷,因为其耐腐蚀性和可涂漆性会严重下降。
当将机器学习(ML)方法应用于镀锌钢的加工和维护时,预测性维护、缺陷识别和机械性能改进都取得了令人鼓舞的进展。研究考察了多种用于镀锌钢的机器学习应用,重点在于改善拉伸性能、监控焊接缺陷、简化镀锌工艺以及预测腐蚀和维护需求。传统的钢铁表面检测方法主要依赖于人工视觉检查或基于规则的机器视觉系统。尽管这些技术在工业环境中被广泛使用,但它们受到主观性、规模问题和复杂操作系统中的可靠性降低的限制。工业数据的日益丰富以及计算智能的进步激发了人们对基于机器学习的缺陷检测系统的学术兴趣。这些解决方案比传统方法更加自动化、准确和灵活(Terrados-Cristos等人,2021年)。
尽管有这些发展,机器学习模型在工业缺陷预测方面的效率仍受到多种问题的限制。由于传感器故障、数据采集问题或工艺中断,真实世界钢铁制造数据集中经常出现缺失值。此外,这些数据集通常表现出显著的类别不平衡,有缺陷的样本远少于无缺陷的样本。高维特征空间和多样化的数据类型加剧了学习过程。如果这些问题没有得到充分解决,预测模型容易偏向多数类,并且对少数类缺陷模式的泛化效果不佳。
集成学习通过结合多个学习器来减少方差、偏差和过拟合,已成为提高分类鲁棒性的有前景的方法。诸如Max Voting、Boosting、Blending和Bagging等方法在许多工业分类问题上取得了更好的结果。然而,目前大多数基于集成的缺陷检测研究仅关注分类器级别的聚合,将特征选择和缺失值插补视为独立的、通常简单的预处理步骤。
本研究提出了一种端到端的集成学习框架,用于钢铁表面缺陷预测,该框架结合了特征选择、集成分类和改进的数据预处理来克服这些缺点。为了连贯且可靠地处理缺失数据和分类特征,提出了一种新的多视图插补和特征编码(MVIFE)方法。通过执行分类编码、按特征过滤缺失值以及通过贝叶斯岭回归进行迭代多变量插补,MVIFE能够从不完美的工业数据集中创建可信的数据表示。基于最大信息系数(MIC)的特征选择过程用于捕捉输入特征与缺陷标签之间的线性和非线性关系,从而进一步提高判别能力。
然后将包括Bagging、Boosting、Blending和Max Voting的集成分类架构应用于修改后的特征集。在模型训练期间使用合成少数样本过采样技术(SMOTE)来减轻类别不平衡的影响。使用塔塔钢铁数据库中的真实世界、高度不平衡的钢铁缺陷数据集来评估所提出的方法,该方法专注于预测用于汽车车身板的无缺陷镀锌和镀锌(GA)钢表面。通过准确性、精确度、召回率和F1分数来评估模型性能,以在数据不平衡的情况下提供可靠的评估。
本研究的主要贡献总结如下:
  • 提供了一个基于集成学习的框架,用于自动预测钢铁表面缺陷,以提高表面质量并满足无缺陷车身板的严格行业标准。
  • 通过结合所提出的基于MVIFE的缺失数据处理策略、基于MIC的特征重要性排序和集成分类,开发了一个完全集成的端到端缺陷检测流程,从而在数据不平衡的情况下实现稳健和准确的缺陷识别。
  • 使用来自塔塔钢铁数据库的真实世界工业数据集证明了所提出框架的有效性和实际适用性,显示出其优于单一模型学习方法的表现。
本文的结构如下:第2节概述了与类别不平衡问题密切相关的相关工作。第3节介绍了解决问题的方法。第4节展示了单个模型和集成模型的实验结果和讨论。第5节讨论了我们的工作结论和未来方向。

相关研究

相关研究

镀锌钢的机械性能、工业用途和耐腐蚀性一直是广泛研究的主题。各种镀锌工艺及其对表面质量的影响以及增强耐腐蚀性的方法都受到了深入研究。连续镀锌工艺会产生一层锌涂层,重点研究了合金成分、温度和浸泡时间对涂层性能的影响。

方法论

我们设计了一个三阶段的钢铁缺陷预测系统,如图2所示。它包括三个层次:数据预处理阶段、合成数据生成阶段和集成阶段。该模型的主要原则如下:
1. 数据预处理阶段:在这个阶段,我们确定了改进数据集质量的处理方法,这是在对原始输入数据集进行探索性研究之后进行的。

Steel_Dataset 描述

我们使用塔塔钢铁数据库中的Steel_Defect数据集来验证我们的发现。表2描述了数据集,包括变量及其代码。该数据集的目标列中有两种值类型:有缺陷和无缺陷。这些值在数据集中分别用0和1表示。在预测建模方法中,缺陷检测任务可以被视为一个二分类问题。该数据集包含112个特征和25,718行。在这112个特征中,有18个...

结论

本研究系统地结合了集成分类、基于MIC的特征重要性排序和基于MVIFE的缺失数据处理,为钢铁制造操作提供了一个完全集成的端到端缺陷检测流程。所提出的方法解决了工业缺陷数据集中的主要问题,如缺失值、高维特征空间和极端类别不平衡。
本研究的一个重要贡献是将数据准备和学习过程结合起来

CRediT作者贡献声明

Akhilesh Kumar Singh:撰写——原始草稿、方法论、概念化。 Koushlendra Kumar Singh:监督。 Mrityunjay Kumar Singh:正式分析。 Biswajit Ghosh:验证。 G.R. Dinesh Kumar:数据管理。 Rajesh Shyam Pais:数据管理。 Vivek Sharma:正式分析。

伦理和知情同意

代表所有作者,我声明该手稿尚未在任何地方发表,目前也没有提交给其他期刊审稿,在本期刊做出决定之前也不会提交到其他地方。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

致谢

作者衷心感谢印度Jharkhand邦Adityapur的NIT Jamshedpur计算机科学与工程系机器视觉与智能实验室提供的必要资源和基础设施,以进行这项研究。我们特别感谢Koushlendra Kumar Singh的指导、鼓励和富有洞察力的反馈,这对完成这项工作起到了重要作用。我们还要感谢我们的同事和合作者,包括Mrityunjay Kumar...
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号