WAAM-ViD:迈向基于视觉的通用金属丝弧增材制造监控技术

《Frontiers in Manufacturing Technology》:WAAM-ViD: towards universal vision-based monitoring for wire arc additive manufacturing

【字体: 时间:2025年10月30日 来源:Frontiers in Manufacturing Technology

编辑推荐:

  自主与数据驱动的制造工艺在工业4.0中快速发展,电弧增材制造(WAAM)因能生产大型金属部件备受关注,但其熔池质量控制和可追溯性仍受限于现有监测系统对硬件和视角的依赖。本研究提出一种角度不变的全流程分析管道,集成DeepLabv3语义分割模型(Dice系数达95.90%)和WAAM-ViDNet回归模型(预测精度88.71%),并构建WAAM-ViD基准数据集(含110个多视角视频),突破传统固定摄像头配置的限制,显著提升系统适应性和部署成本效益。

  随着工业4.0的推进,自主化和数据驱动的制造流程正在迅速发展,其中线弧增材制造(Wire Arc Additive Manufacturing, WAAM)作为一种具有潜力的技术,正被用于生产大型金属部件。确保WAAM过程中的质量控制和零件可追溯性仍然是一个活跃的研究领域,因为现有的工艺监控系统通常需要操作员干预,并且是针对特定机器设置和相机配置进行定制的,这限制了其在工业环境中的适应性。本研究通过开发一种角度不变的熔池分析流程,解决了这些挑战,该流程能够从使用不同质量、位置和角度的相机捕获的监控图像中识别基于线材的定向能量沉积(Directed Energy Deposition, DED)的焊缝特征。同时,还引入了一个新的基准数据集WAAM-ViD,以支持未来的研究。所提出的流程集成了两个深度学习模型:DeepLabv3,通过主动学习进行微调,实现了精确的熔池分割(Dice相似性系数为95.90%),以及WAAM-ViDNet,一种基于回归的多模态模型,利用分割后的图像和相机校准数据预测熔池宽度,达到88.71%的准确率。研究结果展示了该流程在WAAM实时工艺监控和控制中的有效性,代表了向完全自主和适应性强的增材制造系统迈出的一步。

在工业4.0背景下,增材制造(Additive Manufacturing, AM)技术,也被称为3D打印,因其在成本效益和设计灵活性方面相比传统制造方法的优势而受到广泛关注。AM起源于20世纪60年代,最初作为快速原型制造技术被引入(Wohlers等,2016)。与传统的减材制造方法不同,AM通过逐层打印材料的方式构建物体,从而允许更复杂的设计和高效的材料使用(Wong和Hernandez,2012;Abdulhameed等,2019)。在众多AM应用中,航空航天行业是金属AM的主要采用者之一,因为该技术能够制造复杂、可定制的金属部件(Blakey-Milner等,2021;Radhika等,2024)。金属AM可以分为多种类型,包括金属挤出、粘结喷射、粉末床熔融和直接能量沉积(DED)。其中,粉末床熔融(PBF)和DED是最常用于航空航天行业的两种方法(Uriondo等,2015)。PBF基于激光选择性熔化粉末金属(Ladani和Sadeghilaridjani,2021),而DED通常使用电弧、激光或电子束熔化金属线材或粉末,直接将其沉积在基材上(Svetlizky等,2021)。PBF适用于制造小而复杂的部件,因其高精度,而DED则更适合生产大尺寸部件,因其更高的沉积速率(Uriondo等,2015)。

近年来,DED金属增材制造的研究显著增长,尤其是在线弧增材制造(WAAM)领域,它正式归类为ISO/ASTM 52900标准中的DED-Arc(Treutler和Wesling,2021;ISO/ASTM 52900,2021)。WAAM利用传统的焊接技术,使用等离子体或电弧焊枪作为热源,熔化金属线材(Chen等,2024)。这种方法能够实现高沉积速率,使WAAM能够逐层制造大型组件。然而,保持一致的焊缝几何形状仍然是一个关键挑战,因为沉积过程对工艺参数的变化非常敏感(Srivastava等,2023)。对于结构应用,连续的工艺监控和质量保证至关重要,以确保尺寸精度和构建完整性,因为工艺不稳定性可能导致层间错位和残余应力积累。

在WAAM中,缺陷可以归因于三个主要因素:材料清洁度、材料反应和工艺不稳定性。材料清洁度与线材中的杂质有关,这些杂质可能促进气孔和其他内部缺陷的形成。材料反应描述了线材与电弧之间的相互作用,其中冷却速率和凝固行为的变化可能引入气孔、裂纹和微观结构不规则性。这些内部缺陷通常在生产过程中难以检测,通常需要先进的无损检测技术,如计算机断层扫描成像(Stavropoulos,2023)。相比之下,工艺不稳定性通常可以在现场观察到,这为监测潜在缺陷提供了一种实用手段。不稳定性,包括隆起、机器悬挂、重叠、坍塌和飞溅,可能会破坏均匀的材料沉积,导致融合不足和层间对齐问题(Stavropoulos等,2024;Franke等,2025)。

为了应对工艺不稳定性,研究人员开发了多种实时监控策略,利用电(Li等,2022)、声(Rahman等,2024)和热(Baier等,2022)信号进行缺陷检测。其中,基于视觉的监控方法因其在缺陷检测方面的高效性和非侵入性而被认为是一个特别有前途的解决方案,这在近年来的研究中得到了越来越多的支持。基于视觉的监控方法能够提供对工艺稳定性、几何特征以及熔池温度的直接洞察,间接地有助于熔池温度的分析,为工艺监测提供更可解释和丰富的信息。Tang等(2017)提出了一种基于深度学习的表面缺陷检测方法,通过使用CMOS焊接相机捕捉视觉数据。该相机被安装在焊接炬后方,以减少电弧光的干扰,从而获得清晰的俯视图。图像特征通过卷积神经网络(CNN)提取,并使用支持向量机(SVM)进行分类,准确率达到了95.29%,成功地将五种缺陷类型进行了分类,包括正常焊接状态。

Li等(2023)采用了类似的相机设置,使用YOLOv4(Bochkovskiy等,2020)结合修改的DarkNet53主干网络,通过引入通道注意力机制,提高了特征表示的质量。这种修改后的DarkNet53-attention模型在缺陷识别中实现了94.5%的平均精度。尽管这两种方法在后置相机配置下表现良好,但它们存在一个关键限制:缺陷是在沉积之后才被观察到,这导致了检测延迟。为了缓解这一问题,一些研究集中在熔池的视觉分析上。熔池的几何特性受到WAAM工艺参数的显著影响(Srivastava等,2023),因此分析熔池可以作为预测沉积过程中潜在缺陷的指标。然而,由于熔池位于电弧下方,电弧光的强烈干扰使得熔池分析面临挑战。Lee等(2021)提出分析WAAM过程中的三个感兴趣区域:(1)线材输送区域,(2)熔池和电弧区域,(3)熔池之后的焊缝区域。使用高动态范围(HDR)相机安装在机械臂侧面进行数据采集。通过预训练的VGGNet(Simonyan和Zisserman,2014)对异常进行分类,准确率达到99.7%和96.5%。然而,第二区域的高精度缺乏证据,突显了熔池分析的挑战。

Xia等(2022)研究了几种深度学习模型,用于分析使用HDR相机和650纳米中心波长滤光片采集的熔池图像,以减少电弧光的干扰。评估了GoogleNet(Szegedy等,2015)、VGGNet、ResNet(He等,2016)和EfficientNet(Tan和Le,2019)等模型。所有模型的分类准确率均超过97%,其中ResNet表现最佳,达到97.62%。这些模型被微调以分类四种WAAM缺陷类型:正常、隆起、气孔和机器悬挂。Zhang等(2023)则研究了VGGNet、EfficientNet、ResNet和ResNeXt(Xie等,2017)在WAAM材料层沉积过程中常见缺陷(如重叠、坍塌和飞溅)分类中的应用。使用了850-1100纳米波长范围的电荷耦合器件(CCD)相机,并引入了滤光片以增强图像质量。在评估的模型中,ResNeXt模型表现最佳,准确率高达98.56%。此外,分类模型的输出被集成到一个早期预警系统中,以支持实时工艺监控。

尽管这些研究在应用深度学习和基于视觉的方法到WAAM工艺监控方面取得了成功,但当前文献中仍然存在一些局限性。许多研究集中在缺陷分类上,而对熔池几何分析的关注较少。即使在涉及几何分析的研究中,也普遍依赖于专门的图像采集设备,且模型通常在相同的配置下进行测试,这引入了偏差并限制了系统的适应性。这种对硬件配置的依赖性降低了方法的适应性,因为在不同的WAAM系统中,复制精确的相机布置可能不可行,因为机器设计和限制的差异。此外,许多研究将相机安装在系统后方,面向熔池,这限制了可观察角度并增加了在其他WAAM设置中适应或集成的难度。

此外,大多数方法依赖于基于阈值的分割和轮廓提取,这使得它们对环境变化(如不一致的照明和电弧干扰)非常敏感。这限制了模型在不同传感器配置和相机角度下的泛化能力。总体而言,当前文献中缺乏专注于开发适应性强的熔池尺寸分析流程的研究,且缺乏公开的数据集进一步限制了工艺监控系统的进展。这些挑战突显了开发一个稳健且适应性强的基于视觉的熔池分析流程的必要性,同时还需要可访问的数据集来促进可重复性和广泛采用。

本研究旨在解决当前文献中的一个关键缺口:现有工艺监控系统在不同机器、相机配置和观察条件下的有限转移性和适应性。通过提出一个新型的、角度不变的基于视觉的流程,实现更易集成到其他WAAM系统中的熔池尺寸分析。该流程的主要目标是开发一个基于视觉的流程,实现熔池分割的最先进性能,同时实现熔池分析的相对精度。与现有方法不同,所提出的方法不需要光学滤波器或主动成像设备,提高了在标准WAAM环境中的适应性。通过减少对专门硬件的依赖,该方法还降低了WAAM系统的整体设置成本。

此外,本研究还旨在提高数据可用性,解决当前文献中缺乏基准数据集的问题。其次要目标是引入一个新的基准数据集,该数据集包含从多个相机方向采集的熔池记录,以支持更通用的基于视觉的分析技术。该数据集包括使用被动HDR相机和主动激光照明相机采集的熔池记录,使得其在不同的成像条件下具有更广泛的应用性。该基准数据集旨在支持和促进对更稳健和通用的基于视觉的熔池分析方法的进一步研究。

本文的结构如下。第1节介绍了AM系统的背景,并回顾了当前WAAM工艺监控的最先进方法。第2节介绍了新的基准数据集WAAM-ViD,用于角度不变的熔池尺寸分析。第3节详细描述了开发一个角度不变的基于视觉的流程,用于精确的熔池尺寸分析。提出了一个新的多模态深度学习模型WAAM-ViDNet,用于稳健的熔池宽度预测,并将其集成到流程中。第4节对各种相机方向对熔池尺寸分析性能的影响进行了全面研究,从而确定了最佳的相机配置。第5节提供了结论,并在补充材料中包含了一个用于定性分析的分割评估表。

WAAM-ViD数据集的介绍
本节介绍了新的基准数据集,称为线弧增材制造视频数据集(WAAM-ViD),并概述了数据采集过程。该数据集包含110个视频,每个视频的平均时长为26.5秒,以25-30帧每秒(FPS)的速度进行采集。视频使用两种类型的相机在不同的方向上以不同的角度进行采集:被动HDR相机(n=80)和主动激光照明相机(n=30)。表1列出了每个方向采集的视频数量。此外,数据集包括详细的元数据,如相机矩阵、畸变系数、旋转矩阵、平移向量、外部照明的有无、电弧电流、行进速度和焊缝尺寸。

WAAM-ViD数据集已被公开发布,以支持和鼓励进一步研究角度不变的基于视觉的熔池分析。该数据集包含用于主动学习训练过程的每个视频帧的手动注释分割掩膜,采用标准的COCO JSON格式,以确保与广泛使用的计算机视觉框架的兼容性。所开发的深度学习模型的微调参数也包含在数据集中。元数据以CSV格式提供,所有视频文件以MP4格式存储。该数据集特别适合用于语义分割和角度不变的熔池分析基准测试。该数据集可以通过以下链接访问:https://doi.org/10.57996/cran.ceres-2763。

系统设置
数据是使用基于计算机数控(CNC)的WAAM系统采集的,该系统配备了两个熔池监控相机:Xiris XVC-1000和CAVITAR C400-H。实验使用等离子转移弧WAAM,采用ER70S-6钢线(?1.2毫米)。等离子体焊枪安装在CNC机床上,完整的工艺参数如表2所示,图1展示了系统的概述。

Xiris XVC-1000是一种单色HDR CMOS相机,能够以55 FPS的速度成像,分辨率为1280×1024像素。它具有6.8微米的像素大小和超过140分贝的宽动态范围,使其在高强电弧条件下能够有效成像。CAVITAR C400-H则提供了高达100 FPS的成像速度,当使用集成的脉冲激光照明时,其分辨率为1440×1080像素。内置的645±10纳米窄带激光显著抑制了电弧光的干扰,从而增强了熔池的可见性。该相机优化了200毫米的工作距离,并在该距离范围内提供了约40毫米×30毫米的视野范围。

通过使用两种具有不同传感技术和光学配置的相机,开发了一个适用于通用监控流程的数据集。这种设置使得在广泛的观察角度、照明条件和空间分辨率下捕捉到多样化的图像数据集成为可能。相机被放置在五个主要方向上:顶部后方、顶部中央、顶部前方、侧方中央和侧方前方,如图2所示。在每个方向内,相机的角度和距离被系统地变化,以进一步丰富数据集并提高模型的鲁棒性。此外,外部照明被引入以模拟不同的环境条件,从而增强所捕捉场景的异质性,确保模型在现实和具有挑战性的条件下进行训练和验证。

数据标注
训练和测试数据由两位标注员独立进行标注,并由一位拥有超过10年AM和WAAM经验的高级专家进行最终确认。分割的地面真实数据使用RoboFlow软件(Dwyer等,2024)生成,其中采用RoboFlow-v3分割模型(Gallagher,2023)进行初始标注。随后,这些分割掩膜被审查并手动纠正,以确保准确性。帧对帧标注被实施,其中训练数据集标注了3024帧,测试数据集标注了1650帧。

方法论
所提出的方法通过引入角度不变的熔池分析,解决了当前文献中的一个空白。该方法旨在更方便地与其他WAAM系统集成,提高适应性和泛化能力。图4展示了方法的概览,其中采用了主动学习范式来训练分割模型,以缓解标注数据有限的挑战。

数据预处理
所有视频均被标准化为MPEG-4格式(ISO/IEC,2003),使用H.264视频编码器(ITU-T,2019)。此外,在编码阶段识别并删除了损坏的帧。视频被调整为256×256像素的大小,并对每个像素通道应用了Z-score归一化,如公式1所示:

Z_pixel = (pixel - μ) / σ = (R_pixel - 0.485)/0.229, (G_pixel - 0.456)/0.224, (B_pixel - 0.406)/0.225

其中μ和σ分别表示均值和标准差。归一化参数设置为来自ImageNet数据集的标准均值和标准差(Deng等,2009),以确保与预训练的DeepLabv3模型的兼容性。此外,应用了伽马校正以增强图像质量,因为消融研究显示伽马校正可以提高分割模型的性能。

数据增强
为了应对有限的标注训练数据,应用了数据增强技术,将数据集的大小增加了三倍,使用RoboFlow软件(Dwyer等,2024)。数据增强是深度学习中常用的技术,用于增加数据集的大小和多样性,以应对过拟合并帮助模型泛化(Alomar等,2023)。应用了几何和光度变换来增强数据多样性,包括随机水平翻转、旋转(±45°)、饱和度变化(±25%)、亮度变化(±5%)和曝光变化(±5%)。数据增强显著提高了训练数据集的大小和多样性。

DeepLabv3
为了实现精确的语义分割,采用了DeepLabv3模型(Chen等,2017b),使用ResNet-50作为主干网络(He等,2016),该模型在COCO分割数据集上进行预训练(Lin等,2014)。DeepLabv3在早期的DeepLab模型(Chen等,2014;2017a)基础上进行了改进,通过进一步改进空洞卷积和空洞空间金字塔池化(ASPP)模块,实现了多尺度特征提取。与早期版本依赖于条件随机场后处理不同,DeepLabv3消除了这一依赖,同时提高了分割精度。模型首先使用ResNet-50提取低级特征,然后通过空洞卷积进行优化,最后通过ASPP进行多尺度采样。这种方法允许模型准确检测和分割感兴趣区域,同时保持高分辨率特征。

空洞卷积
空洞卷积,也称为膨胀卷积,最初由Holschneider等(1990)引入,并后来在DeepLab模型中(Chen等,2014;2017a;2017b)用于语义分割任务。空洞卷积允许在不牺牲特征图空间分辨率的情况下捕获高级特征。对于具有空间维度H×W的2D数据,1D空洞卷积可以数学表达为公式2所示:

y[i] = ∑x[i + r·j] · w[j]

其中y[i]表示输出特征在位置i,x表示输入特征图,w表示卷积滤波器,r表示空洞率。在DeepLabv3中,级联的空洞卷积和多网格策略被用于实现多尺度特征提取。ASPP结合多个并行的空洞卷积与空间金字塔池化,使得模型能够有效地捕获不同尺度的信息。

消融研究
消融研究在深度学习中广泛用于评估单个组件对整体模型性能的影响。在本研究中,采用消融方法评估了不同的图像增强技术、弹性变换和损失函数对DeepLabv3模型性能的影响。DeepLabv3模型使用第一轮标注数据的子集进行训练,并对不同的预处理和训练配置进行了系统测试。根据消融研究的结果,选择了伽马校正与Dice BCE损失函数的组合,将其集成到主动学习流程中。

图像增强和变换
评估了四种不同的图像增强技术:伽马校正(Guan等,2009)、图像锐化(Schavemaker等,2000)、HDR滤波器(Lim等,2007)和对比度受限自适应直方图均衡化(CLAHE)(Pizer等,1990)。所有增强均使用OpenCV库(Bradski,2000)实现,而弹性变换则使用Albumentations库(Buslaev等,2020)实现,均在原始和增强图像上进行应用。

损失函数
评估了两种损失函数:Dice损失和Dice + BCE损失对模型优化的影响。Dice损失通过计算预测分割掩膜和地面真实之间的重叠来优化模型,如公式3所示:

L_Dice(PM, GT) = 1 - 2·|PM ∩ GT| / (|PM| + |GT|)

其中GT表示地面真实掩膜,PM表示预测掩膜。Dice损失的范围从0到1,其中0表示预测掩膜与地面真实完全重叠,而1表示没有重叠区域。这种特性使其非常适合优化二值语义分割任务。

BCE损失(公式4)则比较预测和地面真实概率分布:

L_BCE(PM, GT) = -[GT·log(PM) + (1 - GT)·log(1 - PM)]

其中PM表示预测掩膜,GT表示地面真实。结合损失函数(公式5)平衡了区域和概率优化:

L_Dice+BCE(PM, GT) = 0.5·L_Dice(PM, GT) + 0.5·L_BCE(PM, GT)

这种结合使得模型能够同时优化空间重叠和像素级分类精度。

主动学习
主动学习是一种训练范式,其中模型最初在有限的标注数据上进行训练,并通过未标注数据集进行评估。选择不确定性或准确性最低的样本进行标注,这些样本用于重新训练模型。这一循环重复进行,直到模型达到满意性能或收敛。通过让模型优先选择最相关的标注样本,主动学习提高了训练效率并减少了标注成本,因为只有部分数据需要手动标注(Wu等,2022)。在本研究中,主动学习范式被采用,其中DeepLabv3模型在初始训练数据集上进行训练,并进一步微调低准确性和高不确定性的样本。

为了评估模型性能,选择了准确率最低的视频进行分析。对于定性评估,对分割的熔池进行了视觉检查,其中开发了一种结构化的评估表(见补充材料)以进行一致的视觉检查。评估表有五个标准,每个标准从1(差)到5(优秀)进行评分。为了减少潜在的偏差,由四名独立评估员进行评估,并计算平均分数。对应于高平均熵和低定性评估分数的相机方向被优先选择,随后在这些视角下采集的视频被用于标注。

定量不确定性通过每视频的平均熵计算。通过适应Shaar等(2024)提出的方法,使用香农熵(Shannon,1948)来衡量分割的不确定性,其中更高的熵值表示更高的不确定性。香农熵(公式6)衡量预测掩膜的不确定性:

H(PM) = -∑x∈PM p(x) log p(x)

其中p(x)是预测掩膜上的概率分布。DeepLabv3模型在主动学习的第五轮训练中达到最佳性能。为了评估模型在每一轮训练后的性能,计算了每个视频的不确定性。随着训练的进行,模型的不确定性在第五轮训练中开始增加,表明模型可能开始过拟合。因此,训练在第五轮后终止,并选择了第四轮的模型参数进行最终评估。这些参数随后被集成到角度不变的熔池尺寸分析流程中。

后处理
为了进一步提高分割的准确性,应用了后处理以减少预测掩膜中的噪声。主要目标是抑制帧中其他焊缝的误分割,同时保留熔池的实际区域。采用Kim等(2024)提出的方法,该方法保留了每个掩膜中最大的连通区域,并移除了可能为噪声的小、浮动掩膜。这种噪声减少方法是Salembier等(1998)提出的开放区域滤波器的适应,使得熔池掩膜的生产更加干净和准确。

尺寸分析
提出了一种基于回归的深度学习模型WAAM-ViDNet,用于角度不变的熔池尺寸分析。WAAM-ViDNet整合了AlexNet(Krizhevsky等,2012)作为其主干网络,并设计为一种多模态架构,基于两个输入特征预测熔池宽度:(1)分割的熔池图像,和(2)相机校准元数据。选择AlexNet作为特征提取器,因其在图像分析任务中的已验证有效性和广泛采用(Ding等,2018;Barbhuiya等,2021;Akbar等,2022;Sarkar等,2023),以及其轻量结构,相较于更先进的视觉模型。

如图6所示,特征通过AlexNet从分割的熔池中提取,并与在第3.2节中获得的校准元数据进行拼接。这个组合特征向量通过一系列全连接层,结构化为回归流程,以预测熔池宽度。由于模型输出连续值,数字超过小数点后一位被舍弃,以减少浮点不一致并与地面真实精度对齐。

为了确定最佳网络配置,实施并评估了五种不同的人工神经网络架构,如表3所示。所有候选模型使用相同的训练数据集和一致的训练过程进行训练,以确保公平比较。根据评估结果,选择了最佳的WAAM-ViDNet配置。

WAAM-ViDNet v2模型的性能在不同相机方向下有所变化,如表6所示。尽管WAAM-ViD v2模型在所有相机方向上实现了可比的准确性,但预测误差在9.43%到13.23%之间波动。最佳性能出现在HDR Xiris XVC-1000相机的顶部前方方向,而最差性能出现在HDR Xiris XVC-1000相机的侧前方方向。这种性能变化可能归因于相机方向的数据分布不平衡,如表1所示,其中两个表现最差的方向对应的数据量最少。

虽然目前的准确率(88.71%)低于一些现有的最先进方法,如Xiong等(2020)实现了3.02%的误差率,Dong等(2024)报告了0.55%的误差率。这些研究主要集中在单个、优化配置的相机设置上,该设置能够从俯视角度完整捕捉熔池几何形状。相比之下,本研究的数据集涉及不同方向的视频,因此引入了更大的变量和更复杂的分析任务。目前的研究是首个评估多角度WAAM熔池分析的,这为未来研究提供了重要的基准。

局限性和未来工作
尽管所提出的角度不变熔池分析流程展示了相对较高的准确性,但仍需承认一些局限性。首先,分割模型中存在诸如过分割和欠分割的错误。这些错误可以通过基于熵的后处理方法进行解决。

其次,当前的后处理方法存在一定的局限性。在本研究中,采用Kim等(2024)提出的方法,该方法结合了开放区域滤波器(Salembier等,1998)。然而,开放区域滤波器仅保留最大的连通分割掩膜,这存在无意中分割区域面积大于实际熔池的潜在风险。这可能导致目标分割掩膜的抑制。因此,进一步研究后处理方法对于该模型至关重要。

此外,本研究的一个主要限制是未对实时工艺监控进行深入探讨。尽管所提出的流程在Nvidia RTX 4070 Ti Super GPU上实现了每帧0.014秒的推理时间,但预计在计算能力较低的设备(如CPU或嵌入式系统)上部署时,推理时间会增加。因此,需要进一步研究以提高模型的计算效率。可以考虑轻量级分割模型,如TinySegformer(Zhang和Lv,2024)或Lightm-Unet(Liao等,2024)的实现。此外,WAAM-ViDNet模型需要进一步微调,以减少计算成本同时保持或提高性能。

最后,增加模拟WAAM缺陷的数据,如隆起,将显著增强WAAM-ViD数据集。目前,该数据集仅包含在正常操作条件下进行的WAAM视频,这限制了熔池尺寸的可变性。数据收集的单系统和单合金配置限制了数据集的多样性,尽管这对于当前研究的主旨(熔池分割和宽度预测)影响较小。然而,加入涵盖不同熔池尺寸、多样化WAAM系统和不同合金的数据将有助于提高数据集的多样性,减少数据不平衡,并提高基于该数据集训练的模型的泛化能力。

工业影响
尽管所提出的流程展示了有希望的结果和增强现有工艺监控系统通用性的巨大潜力,但必须解决一些局限性。本研究引入了一种新颖的监控方法,旨在提高其适应性和与现有WAAM系统的集成能力。虽然开发的模型能够准确预测熔池尺寸,但某些相机配置会阻碍人工操作员的视觉验证,这可能降低信任度并限制实际部署。

随着工业向工业5.0发展,可解释性和可信度成为有效人机协作的关键因素,使操作员能够将注意力转移到更高层次的决策任务上。然而,这些方面在本研究中并未得到充分探讨。尽管在主动学习过程中探索了不确定性估计,但其在提升模型信心和操作员信任方面的更大潜力尚未被充分利用。需要专门的研究来进一步探讨工艺监控系统中的不确定性量化和可解释性,以实现可靠和可信的工业部署。

此外,识别出的分割错误、计算效率低下以及需要进一步微调等实际挑战必须在流程部署到实时工业环境之前解决。未来的工作将专注于提高分割准确性、增强计算效率并提高在动态环境中的鲁棒性,特别是提高透明度、可解释性和信任度,以支持可靠的智能系统集成。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号