从产品规格到智能制造:基于生成式人工智能的流程创新,实现BOM(物料清单)数字化及其应用
《ADVANCED ENGINEERING INFORMATICS》:From product specifications to smart manufacturing: Generative AI-driven process innovation for BOM digitization and its applications
【字体:
大
中
小
】
时间:2026年02月13日
来源:ADVANCED ENGINEERING INFORMATICS 9.9
编辑推荐:
智能BOM数字化框架与生成式AI应用|跨语言物料编号标准化|检索增强生成(RAG)|智能制造转型|成本节约优化
林宇治|邓志锋
台湾国立科技大学智能制造技术研究生院,台北,台湾
摘要
随着全球制造业向数字化转型和智能运营迈进,产品规格文档与物料清单(BOM)之间的无缝集成变得日益重要。传统的BOM创建过程严重依赖人工解释,这常常导致零件编号不一致、记录冗余以及工程周期延长,尤其是在文档结构不规范且多语言的情况下。为了解决这些问题,本研究提出了一个基于生成式AI的框架,该框架将大型语言模型(LLMs)与检索增强生成(RAG)相结合,以实现智能BOM的数字化。该框架建立了一个闭环流程,通过多阶段文档解析、知识检索和受限解码,将非结构化的产品数据表转换为规则验证且语义一致的部分编号。引入了人工参与验证机制,以确保语义精确性和可追溯性。借助Qwen模型的多模态能力,该框架能够有效解析和理解中英文双语技术文档,从而提高跨语言的语义理解和数据准确性。经过验证的输出被整合成一个可执行的电气和数字BOM(x-EDBOM),作为产品生命周期管理(PLM)、企业资源规划(ERP)和制造执行系统(MES)中的统一真实来源。在一家中型电子制造商处的实证验证表明,处理时间减少了12.5倍(从25分钟缩短到2分钟),平均准确率为91%,每月节省的成本约为70万美元。此外,x-EDBOM还能够跨多个供应商比较分析相同部件的价格、交货时间和规格数据,从而支持数据驱动的采购优化和供应商管理。除了提高效率外,该框架还支持跨语言数据标准化、供应商基准测试以及合并后的系统协调,为智能产品数据管理和智能制造转型提供了可扩展的基础。
引言
近年来,许多跨国制造商通过并购(M&A)作为战略手段来获取资源并应对国际贸易中的关税壁垒等地缘政治挑战[1]、[2]。通过并购,企业可以迅速扩展其国际供应链,从而进入新市场和供应商网络[1]、[3]。然而,合并后的整合往往在标准化产品数据方面遇到重大困难,尤其是在将收购公司的零件编号系统与母公司对齐时。根据Epstein[4]的观点,内部系统的兼容性——包括技术应用、运营流程和数据管理——也是并购成功的关键因素。在许多情况下,被收购的工厂使用独特的且文档记录不足的零件编号,这些编号通常与母公司的命名标准不一致,使得整合变得困难。此外,这种不一致性还会直接影响物料清单(BOM)的准确性和一致性。当零件编号系统不匹配时,错误可能会传播到多层次的装配结构和生产计划中。BOM作为连接设计规范、工程图纸和采购数据的中心参考,在整个产品生命周期中起着关键作用。实际上,企业可能会收购地区性工厂以优化供应链或支持全球扩张,但可能会发现被收购实体的生产管理系统与母公司不兼容。一些被收购的工厂缺乏结构化的零件编号编码,而是依赖简单的序列号进行发货。这种情况使得母公司难以在收购后迅速整合系统并实现有效的生产管理。这一情况凸显了制造业数据管理中存在的更广泛挑战,从而需要更强大的解决方案。因此,本研究提出了一个适用于跨语言和跨境并购背景下的流程应用框架,旨在提高下游运营流程的效率。
在制造业中,产品规格文档(如数据表、产品手册和供应商认证文档)是定义零件特性、合规要求和工程指南的重要资源。这些文档对产品设计、采购、生产计划和生命周期管理等功能至关重要。然而,这些文档的格式多样且大多是非结构化的,因此人工解释和企业数据录入既耗时又容易出错,可能导致企业系统中频繁出现错误。通常,工程师需要手动审查规格文档,提取相关信息并根据内部命名规范分配唯一的零件编号。如图1所示,传统的工作流程包括多个重复步骤:文档分割、手动复制粘贴提取、逐字段验证以及将数据录入产品生命周期管理(PLM)或企业资源规划(ERP)系统。错误往往在后期阶段被发现,导致大量的返工和流程延误。此外,随着制造过程变得更加复杂和产品变体增多,这种手动方法无法满足速度、准确性和可追溯性的要求。常见问题包括重复的零件编号和不一致的数据录入。此外,缺陷可能仅在原型制作或后期生产阶段才会显现。这些问题需要昂贵的返工、供应链中断和增加的成本,从而削弱整体竞争力。为了缓解这些问题,企业越来越多地采用基于AI的方法来理解和组织规格文档。值得注意的是,大型语言模型(LLMs)与检索增强生成(RAG)的结合利用了深度语言理解和动态的领域知识整合能力。LLMs可以解释难以用严格规则流程捕捉的复杂文本,而RAG则能实时检索相关领域信息,有助于降低错误风险。因此,这种基于AI的方法比传统的基于规则或模板的方法更具适应性,并且在需要领域知识时可以提高可靠性。基于这一优势,我们提出了一个端到端自动化流程,将文档数字化、智能内容提取和基于规则的验证整合在一个模块化框架中。该流程用协调的过程取代了碎片化的复制粘贴工作流程,并将企业业务规则直接嵌入数据生成循环中,为跨语言、地区和组织边界的一致性零件编号系统重建提供了可扩展的基础。为了明确本工作的贡献,以下总结了理论、方法论和实践方面的贡献。
本研究从治理角度出发,探讨了制造业主数据数字化的方法,展示了如何在企业约束下实现LLM推理。特别是,该框架使用了检索基础、显式模式/外键验证和受控回写机制,支持BOM数字化中的语义标准化和跨语言一致性。这种框架将生成式AI能力与企业数据治理要求相结合,在这种情况下,无约束的生成通常是不可接受的。
我们开发了一个基于AI的框架,用于自动化零件编号生成和BOM数字化。该框架集成了多模态文档解析、检索增强生成(RAG)、JSON模式和外键验证以及人工参与验证,确保了整个工作流程中的可追溯性和治理性。特别是,该框架利用多模态Qwen模型解析和理解中英文双语技术文档,增强了跨语言理解和数据一致性。与完全生成的流程相比,所提出的方法通过验证和受控持久性来约束输出,从而在生产工作中实现稳定运行。
本研究实现了一个可执行的电气和数字BOM(x-EDBOM),它同步了PLM、ERP和MES,作为主数据的统一“单一真实来源”。通过一个工业案例研究验证了该框架的有效性,处理时间减少了12.5倍(从25分钟缩短到2分钟),在10倍交叉验证的概念验证中平均准确率为91%。我们进一步估计每月可节省约70万美元的成本,这是基于劳动时间节省的假设(而非直接财务核算)。案例证据还表明,x-EDBOM适用于采购比较(价格/交货时间/规格整合),并表明其作为智能制造数字化转型基础的潜力。
本文的其余部分安排如下:第2节回顾了与BOM和LLMs应用相关的先前研究;第3节介绍了将LLM与RAG结合的框架;第4节使用真实世界工业数据验证了所提出的算法;最后,第5节总结了主要发现并概述了未来研究的潜在方向。
节选内容
BOM的应用
如前所述,建立一个涵盖从原材料到成品所有阶段的全面可追溯系统既至关重要又具有挑战性[5]。在生产管理中,BOM不仅是产品数字线索中的核心要素,还是连接工程设计、供应链采购和生产计划的关键纽带[6]。然而,产品种类的增加和定制化的需求使得手动维护BOM变得非常耗时
研究方法
我们在第3.1节介绍了所提出的框架,并随后解释了如何通过RAG启用的提示和受限解码来提高文档解析和信息提取的准确性。一旦生成的标识符被整合到x-EDBOM中,相应的优势和应用场景也会得到讨论。
实证案例研究
本节介绍了一家在低产量、高混合环境下运营的中型电子制造商的现场实证研究。在这种环境中,频繁的换线和广泛的定制化产生了大量的新零件编号请求,非常适合研究手动主数据创建的时间和质量影响。因此,提出了该框架来应对这些挑战。
结论
在低产量、高混合的电子产品制造中,频繁的换线和新部件引入是常态,手动的主数据录入会导致重复和错误录入,这些问题会在PLM/ERP/MES中层层传递,增加MRP异常,延迟发布,并引发昂贵的返工和客户投诉。在并购整合(需要快速协调异构的遗留语义)和跨语言操作(命名/单位变化加剧身份冲突)的情况下,风险更加复杂。
CRediT作者贡献声明
林宇治:可视化、验证、资源管理、数据整理。邓志锋:撰写初稿、软件开发、项目管理、方法论制定、资金获取、正式分析、概念化。
利益冲突声明
作者声明他们没有已知的可能会影响本文报告工作的财务利益或个人关系。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号