综述:机器学习算法在制造质量保证中的应用:性能指标与应用的系统综述

【字体: 时间:2025年04月22日 来源:Array 2.7

编辑推荐:

  本文系统综述了机器学习(ML)算法在制造质量保证(QA)中的应用。通过分析超 300 篇研究,评估了 ANN、SVM 等算法的性能,提出比较框架辅助算法选择,探讨了挑战与未来方向,为制造业应用 ML 提供了重要参考。

  

1. 引言


随着工业 4.0 的发展,制造业正经历变革,机器学习(ML)算法在其中发挥着关键作用。ML 能助力制造商从大量数据中获取有价值信息,推动质量保证和过程优化创新,例如实现预测性维护、实时质量控制等。然而,在制造质量保证中应用 ML 仍面临诸多挑战。

1.1 研究背景和动机


ML 在制造业的应用潜力于 2014 年开始凸显,但其测试和尝试早在之前就已开始。从 20 世纪 70 年代起,ML 就逐渐应用于制造业,如 1978 年开发的用于装配线的 SCARA 机器人手臂。如今,ML 在制造业的应用广泛,涵盖预测性维护、质量控制等多个方面,但仍存在一些问题。

1.1.1 缺乏统一的比较框架


目前,在制造质量保证中应用 ML 缺乏结构化的比较框架,现有研究往往是碎片化的,难以系统比较不同 ML 技术在不同条件下的性能,这使得行业专业人员难以选择最适合的 ML 方法。

1.1.2 研究中性能指标不一致


不同研究评估 ML 模型使用的性能指标不统一,包括分类指标、回归指标、计算效率、可扩展性和稳健性等,这增加了比较 ML 模型的难度,也阻碍了得出关于其适用性的一般性结论。

1.1.3 跨行业实施见解有限


虽然 ML 在多个行业有应用,但缺乏跨行业的综合见解,不同行业使用不同的 ML 算法解决质量保证问题,但没有统一的研究对这些技术进行比较,导致资源浪费和模型选择不合理。

1.2 目标和贡献


本文旨在全面分析 ML 算法在制造质量保证中的应用及性能,指导行业采用最有效的 ML 技术优化质量保证过程,降低成本,提高运营效率。其主要贡献包括与工业 4.0 理念契合、展示实际应用案例、评估算法性能指标以及为决策提供统计分析依据。

2. 文献综述


工业生产随着信息技术的发展而不断演变,ML 在其中的应用也经历了多个阶段。

2.1 制造质量保证中的机器学习技术


ML 融合了多学科知识,其在制造质量保证中的发展可追溯到早期的手动检查阶段,之后经历了统计过程控制(SPC)、早期自动化与专家系统、早期 ML 应用等阶段,如今已进入 AI 驱动的智能工厂与超自动化时代。在这个过程中,ML 的分类和应用不断丰富。

2.2 利用机器学习算法进行制造质量保证


深度学习(DL)和计算机视觉(CV)技术的发展进一步推动了制造质量保证的进步,例如卷积神经网络(CNN)在缺陷检测中表现出色。然而,ML 系统在大规模实施时仍面临数据质量、模型可解释性和计算约束等挑战。新兴框架如 CRISP-ML (Q) 试图解决这些问题。

2.3 机器学习优化制造质量保证


ML 在制造质量保证中的应用广泛且多样,包括缺陷检测、预测性维护、过程优化等。不同的 ML 技术在不同的应用场景中发挥着重要作用,例如循环神经网络(RNN)用于预测性维护,CNN 用于实时质量控制等。

2.4 质量保证中 ML 的性能指标


评估 ML 模型在制造质量保证中的有效性通常使用多种性能指标,这些指标能反映模型的准确性、可靠性和操作可行性。

2.4.1 准确率和精确率


准确率衡量模型正确预测的比例,精确率关注正确检测出的缺陷在所有预测为缺陷中的比例。人工神经网络(ANNs),尤其是使用 CNN 的模型,在工业缺陷检测中能达到较高的精确率。

2.4.2 召回率


召回率衡量模型正确识别所有缺陷的能力,对于预测性维护和故障检测应用至关重要。支持向量机(SVMs)和随机森林(RFs)在这些应用中具有较高的召回率。

2.4.3 计算效率


计算效率涉及 ML 模型的处理速度和资源利用。复杂模型如 ANNs 性能虽好,但计算成本高;决策树(DTs)和 K 近邻(KNN)等模型计算简单、速度快,适用于资源有限的环境。

2.4.4 可扩展性


可扩展性指模型在数据量增加时保持或提高性能的能力。RFs 在处理高维传感器数据时表现出良好的可扩展性,能在数据集扩大时维持较高的准确率。

2.4.5 实时处理


实时处理对于连续生产线的质量保证至关重要。ANNs 和 SVMs 常用于电子等行业的实时缺陷检测,KNN 在小规模应用中有时也用于实时监测。

3. 研究方法


本文通过系统的研究方法评估 ML 算法在制造质量保证中的应用。

3.1 系统综述方法和数据收集


研究遵循 PRISMA 框架,确保评估的严谨性和全面性。通过在多个学术数据库中进行系统搜索,使用布尔运算符和关键词组合,筛选出相关的研究。

3.1.1 数据来源和搜索策略


搜索范围涵盖多个学术数据库和在线资源,优先选择同行评审的期刊文章、会议论文和工业案例研究,排除不相关的研究。

3.1.2 纳入标准


纳入的研究需聚焦于 ML 在制造质量保证中的应用,提供定量性能比较或实证结果,且发表时间在过去二十年。

3.1.3 研究选择过程


研究选择过程包括识别、筛选、资格评估和纳入四个阶段,通过这一流程确保所选研究能为评估提供有价值的见解。

3.2 比较框架优于分类系统的理由


与传统的基于分类系统的研究不同,本文采用比较框架,基于关键性能指标评估 ML 模型,能更全面、灵活地评估 ML 应用,避免了分类系统可能导致的对复杂情况的简化。

3.3 评估 QA 中 ML 的比较框架


本文开发了一个比较评估框架,从算法效率、计算性能、实时可行性和可解释性及实际部署等维度评估 ML 算法,为研究人员和工业专家选择合适的 ML 技术提供决策依据。

3.4 机器学习算法性能的比较分析


通过对过去二十年研究的综述,考虑多种因素评估不同算法的性能,包括准确率、误差指标、效率等,并分析了模型复杂性和可解释性的权衡。

3.4.1 性能和评估指标


不同算法在不同场景下表现各异,如 RF 在故障检测中表现出色,SVM 在预测性维护中可能更具优势。同时,算法对训练数据的敏感性和泛化能力也有所不同。

3.4.2 制造应用中平衡复杂性和可解释性


在制造应用中,选择 ML 算法需要平衡复杂性和可解释性。复杂模型如 ANNs 和 SVMs 准确性高,但可解释性差;简单模型如 DTs 和逻辑回归可解释性强,但准确性可能较低。

3.4.3 高准确性和有限透明度


在预测性维护等应用中,复杂算法能准确预测,但内部工作原理难以理解,不利于生产团队解决根本问题。

3.4.4 较低准确性和较高可解释性


简单模型如 DTs 和逻辑回归虽然准确性稍低,但可解释性强,能帮助操作人员快速识别问题并采取纠正措施。

3.4.5 基于准确率和 R2(决定系数)的主要比较框架


ML 模型在制造质量保证中的有效性主要通过准确率和 R2评估。准确率对缺陷检测和预测性维护很重要,R2在回归应用中作用显著。不同算法在不同场景下的性能比较表明,选择合适的算法对优化 QA 过程至关重要。

3.5 基于统计和工业评估的综合性能指标比较


通过定量评估不同 ML 模型的关键性能指标,包括准确率、可扩展性、实时效率和可解释性等,并结合行业应用分类,为算法选择提供了实用指导。

3.6 基于数据量的算法适用性


不同 ML 算法对数据量的需求和适应性不同。ANNs 需要大量数据,适合数据丰富的行业;SVMs 在小数据集上表现出色,适用于数据有限的场景。

3.7 算法选择:处理速度与计算复杂性


选择 ML 算法时,处理速度和计算复杂性是重要考虑因素。DTs 和朴素贝叶斯(NB)计算效率高,适合实时应用;ANNs 和 SVMs 准确性高,但计算资源需求大。

3.7.1 理由和见解


不同算法在处理速度、计算复杂性、功耗和实施成本等方面存在差异,应根据具体应用场景选择合适的算法。

3.7.2 模型优化和超参数调整


模型优化技术和超参数调整会影响 ML 算法的性能。复杂模型如梯度提升模型(GBM)需要大量调整来提高准确性,而简单模型则相对容易操作。

3.8 每个行业规范的最佳 ML 模型选择


ML 算法的选择因行业而异,取决于精度要求、法规合规性、数据可用性和实时处理约束等因素。

3.8.1 关键见解和理由


不同行业根据自身需求选择不同的 ML 算法。汽车和航空航天行业依赖深度学习模型进行高精度缺陷检测;制药和食品加工行业则更倾向于可解释的模型以满足法规要求。

3.8.2 特定行业 ML 采用的实际影响


根据行业需求选择合适的 ML 模型能提高质量保证水平,优化生产流程,提高整体效率。

3.9 制造 QA 中 ML 算法部署的战略考虑


ML 算法在制造质量保证中的部署取决于系统基础设施,包括数据质量、计算资源和实时处理要求等。不同模型在不同场景下各有优劣,应根据实际情况选择。

3.10 优化制造质量保证的最佳前瞻性 ML 算法


没有一种算法在所有情况下都优于其他算法,选择最优算法需综合考虑准确性、可解释性、计算效率和实时约束等因素。不同算法在不同制造场景中发挥着重要作用,未来混合 ML 模型等的发展将进一步提升制造质量保证水平。

4. 分析、结果和理由


通过对 ML 算法在制造质量保证中应用的系统综述,得出了关键发现,并探讨了其对工业 4.0 的战略影响。

4.1 关键发现


不同 ML 算法在制造质量保证的不同任务中表现各异。

4.1.1 缺陷检测性能


ANNs 和 CNNs 在基于图像的缺陷检测中准确性高,RF 和 DT 在缺陷分类任务中表现良好,且 DT 具有可解释性优势。

4.1.2 预测性维护和过程优化


SVMs 和 RFs 在预测性维护中表现出色,GBM 和 XGBoost 在优化过程参数方面表现强劲。

4.1.3 大数据集与小数据集性能


ANNs、CNNs 和 XGBoost 在大数据集上表现优异,SVM 和 KNN 在小数据集上表现突出,RF 适应性强。

4.1.4 计算效率和处理速度


RF 和 XGBoost 可扩展性强,ANNs 和 CNNs 计算成本高,DT 处理速度快,适合实时应用。

4.2 工业 4.0 的战略意义


研究表明,ANN 在制造业中的应用日益广泛,SVM 和遗传算法(GA)等也受到较多关注。ML 技术在不同制造行业的应用不断增加,对制造业发展具有重要意义。

5. 挑战、未来方向和改进


虽然 ML 在制造质量保证中有巨大潜力,但仍面临挑战,也有许多未来发展方向。

5.1 挑战


ML 在制造质量保证中的应用面临诸多挑战,如缺乏专业人才、数据质量和可解释性问题、模型选择困难以及对复杂数据的处理能力有限等。

5.2 未来方向


未来 ML 在制造优化方面有多个发展方向。

5.2.1 可解释 AI 技术


采用可解释 AI 技术能提高模型的可解释性,增强人们对 ML 在关键制造过程中应用的信任。

5.2.2 集成学习:制造质量保证的未来


集成学习通过结合多个 ML 模型的优势,能提高准确性、稳健性和可靠性,未来研究应聚焦于优化混合模型、开发自适应框架和标准化评估方法。

5.2.3 联邦学习


联邦学习能改善数据隐私和安全,在分布式制造生态系统中具有巨大潜力。

5.2.4 物联网设备的集成


集成物联网设备进行数据收集和实时监测,能使 ML 模型更准确地预测和优化过程,同时还需要提高模型的实时适应性、与网络物理系统的集成度以及可扩展性和稳健性。

6. 结论


本文为制造质量保证中选择和应用有效 ML 算法提供了全面框架。ML 在制造质量保证中的应用虽处于初期,但潜力巨大。未来,研究人员可进一步探索混合方法,制造商可根据行业需求选择合适算法,以提高效率和降低成本。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号