"熔池动力学:多源熔池数据集助力增材制造视觉分析与机器学习应用"

【字体: 时间:2025年07月21日 来源:Scientific Data 5.8

编辑推荐:

  研究团队针对金属增材制造(AM)中熔池监测数据分散、缺乏标准化的问题,整合了来自23个机构的32个数据集(总计1.9TB原始数据),构建了48.6GB的Melt-Pool-Kinetics数据集。通过图像裁剪、去噪、灰度化等处理,该资源支持机器学习在缺陷检测、微观结构预测等领域的应用,为AM过程优化与控制研究提供了重要基础。

  

在金属增材制造领域,熔池作为材料超热熔化区域,其动态特性直接影响零件质量。然而,不同材料、工艺参数和传感配置导致的多样性,使得熔池数据的标准化成为行业难题。传统研究中,研究人员往往受限于单一来源的数据,难以开发具有广泛适用性的分析模型。这种数据碎片化现状严重制约了机器学习在缺陷检测、微观结构预测等关键应用中的潜力。

针对这一挑战,McGill University(加拿大麦吉尔大学)的研究团队William Jabbour、Mutahar Safdar等人开展了开创性工作。他们系统收集了来自全球23个机构的32个数据集,构建了名为Melt-Pool-Kinetics的综合资源。这项发表在《Scientific Data》的研究,通过标准化处理1.9TB原始数据,最终形成48.6GB的HDF5格式数据集,覆盖激光粉末床熔融(LPBF)、定向能量沉积(DED)等多种工艺,涉及Inconel 718(IN718)、316L不锈钢等7种材料。

研究团队采用多阶段技术方案:首先通过关键词检索从Zenodo、哈佛Dataverse等平台获取数据;其次采用分层采样策略(每1024帧为批次)处理超2万帧的大型数据集;最后开发了包含裁剪、灰度转换(含Jet色彩映射逆变换)、去噪(高斯核9×9)和宏像素分解(5×5波长阵列)的标准化流程。特别设计的双阶段熔池定位算法(局部30×30窗口搜索结合全局阈值)有效解决了飞溅干扰问题。

数据来源与分布特征
研究整合的数据主要来自北美和欧洲机构,其中国家标准与技术研究院(NIST)贡献最大(图2)。值得注意的是,75%数据来自DED工艺(如激光金属沉积LMD),77.42%采用红外成像系统(图3)。这种分布反映了当前开放数据的集中趋势,但也暴露出LPBF工艺数据相对不足的现状。


数据处理与质量控制
针对不同噪声类型(空白帧/随机噪声/传感器噪声),研究建立了三级过滤机制。如图10所示,通过保持熔池特征的同时去除低强度像素噪声(阈值<49),显著提升了数据质量。对于特殊格式如宏像素数据(源16),开发了波长特异性掩模分解技术,将250×250图像转换为25个49×49的单通道光谱图像(图11-12)。


数据集架构与应用验证
发布的HDF5文件采用四级结构(图13):原始数据(Layer I)、处理后数据(Layer II)、时空标记数据(Layer III)和多样性子集(Layer IV)。技术验证显示,通过ResNet50特征提取和k-means聚类(3<>G平均达1.089(公式2),显著优于随机采样。

这项研究的意义在于:首次建立了跨工艺、跨材料的熔池标准数据集,解决了AM领域长期存在的数据孤岛问题。通过提供原始数据与处理版本的双重访问路径(含完整元数据表),既支持特定工艺的深入研究,又为开发通用型机器学习模型(如领域基础模型)创造了条件。数据集的可扩展架构(支持未来新增数据)和多样性子集设计,将显著降低AI模型的训练成本,推动增材制造向智能化方向发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号