《Proceedings of the Design Society》:Life cycle cost estimation in product-service systems: a review of machine learning methods
编辑推荐:
产品服务系统(PSS)的成本规划面临日益增长的复杂性,使得生命周期成本估算至关重要。本文研究了机器学习(ML)如何在产品开发中应用于生命周期成本估算。通过文献综述,研究人员识别了基于机器学习的方法,根据生命周期阶段对其进行了分类,并将其与传统方法进行比较。结果
产品服务系统(PSS)的成本规划面临日益增长的复杂性,使得生命周期成本估算至关重要。本文研究了机器学习(ML)如何在产品开发中应用于生命周期成本估算。通过文献综述,研究人员识别了基于机器学习的方法,根据生命周期阶段对其进行了分类,并将其与传统方法进行比较。结果表明,传统模型在早期阶段虽然保持透明性但能力有限,而机器学习方法在数据丰富的阶段实现了更高的准确性。混合模型和报废成本估算方面存在明显的研究空白。
**产品服务系统中基于机器学习的生命周期成本估算:研究综述与整合框架**
**一、 研究背景与问题提出**
在日益动态和竞争激烈的市场环境中,制造企业通过提供满足客户不断变化需求的创新服务来扩展其产品组合,这催生了将产品与服务整合的业务模式,即产品服务系统(PSS)。PSS将实物产品与服务在整个生命周期中相结合,例如通过延长使用周期和降低保修成本的维护方案。其设计要求进行早期且准确的生命周期成本(LCC)估算,因为大部分LCC在早期开发阶段就已确定。根据其导向(产品导向、使用导向或结果导向),PSS呈现出不同的价值主张,但也因不确定的使用行为、较长的运营阶段以及产品与服务元素之间强烈的相互依赖性,给成本估算带来了特定挑战。因此,PSS的成功实施需要在整个生命周期内整合技术、组织和经济视角的整体方法。可靠的LCC估算对于支持战略决策和开发具有成本效益的解决方案至关重要。
传统的LCC估算主要依赖于历史数据和专家知识,但往往难以捕捉工业PSS的复杂性和不确定性,尤其是在使用和结果导向的场景中,运营行为对成本有强烈影响。近期基于数据的成本核算系统强调了持续数据分析和自适应模型以应对这些局限性的需求。因此,基于机器学习(ML)的方法因其能够利用大量异构数据集并发现传统方法无法触及的成本相关模式而受到关注。尽管关于基于机器学习的成本估算的研究日益增多,但文献仍然零散,缺乏将估算方法与PSS开发中的生命周期阶段、数据可用性和项目定义水平系统关联起来的综合。为填补这一空白,本文献综述旨在将传统和基于机器学习的成本估算方法整合到一个通用的分类框架中,通过将方法映射到生命周期阶段、成本类型、数据条件和估算精度,为方法选择提供结构化指导,并支持跨PSS开发阶段的明智决策。研究问题(RQ)为:哪些机器学习方法已应用于产品服务系统的生命周期成本估算?在不同生命周期阶段和数据可用性条件下,它们能达到何种精度水平?该论文发表于《Proceedings of the Design Society》。
**二、 主要研究方法**
为回答研究问题,研究人员通过两项独立的文献研究,对现有研究进行了全面系统的综述。第一项研究聚焦于识别传统成本估算方法,并根据成本估算分类系统(AACE International Cost Estimate Classification System)验证其分类,特别关注报告的精度和项目定义成熟度。该系统将估算分为五个等级(Class 5 到 Class 1),将项目定义成熟度与预期的估算精度范围相关联。第二项研究则针对应用于成本估算的机器学习方法,明确考虑其数据需求、验证程序和报告的性能指标。研究遵循PRISMA指南以确保透明度和可重复性。通过布尔搜索,在Scopus、IEEE Xplore等数据库中检索了相关文献。经过筛选和应用纳入排除标准,最终有9项传统方法研究和6项机器学习方法研究被纳入最终综合分析。分析中提取了每项研究应用的估算方法、针对的生命周期阶段、数据集特征和报告的评价指标,并使用均方根误差百分比(MAPE)等指标对精度进行了统一评估,以便跨研究比较。
**三、 研究结果**
**4.1. 分析**
对每项研究的数据进行了提取和结构化分析,重点关注应用的成本估算或机器学习方法、所针对的生命周期阶段、数据集特征以及报告的评价指标。这些变量被整合成一个沿生命周期阶段、模型类型、数据可用性和精度对齐的结构化比较表,以识别跨研究的主导模式。
**4.1.1. 传统模型**
综述确定的传统成本估算方法主要依赖于生命周期成本模型、参数化关系、类比模型和框架等方法。这些方法大多是为特定的产品服务背景开发的,并嵌入在电子表格或公司特定工具中,反映了其对专家假设和预定义使用场景的强烈依赖。传统模型的质量从报告的精度和验证的稳健性两个维度进行评估。总体而言,传统方法通常在后期设计或运营阶段为预算和规划提供中等精度,但只有少数研究报告了早期概念阶段的量化精度,因为此时服务使用模式和生命周期交互作用仍高度不确定。这表明传统模型提供了透明且易于理解的基线,但其对早期PSS概念评估的预测性能证据薄弱,主要是由于对未来服务行为和跨阶段成本交互作用的了解有限。
**4.1.2. 机器学习模型**
综述确定了六项将机器学习应用于成本估算用例的出版物,主要关注预测精度而非在工业环境中的实际部署。在整个PSS生命周期中,研究了回归模型、人工神经网络(ANN)、支持向量回归(SVR)、集成方法和混合方法。模型的适用性和性能强烈依赖于阶段和数据。在早期规划和开发背景下,当有足够数据时,回归模型、ANN和SVR能达到中到高精度;然而,其广泛的数据预处理要求和有限的可解释性限制了在需要透明成本驱动因素情况下的接受度。集成方法,如XGBoost、梯度提升(Gradient Boosting)和AdaBoost,始终提供最高的预测精度,特别是在材料、人员、能源和维护相关成本方面。其有效性依赖于大量高质量数据集,因此需要成熟的数据基础设施和跨组织单元的协调数据治理。混合方法(例如SVM结合隐马尔可夫模型)在维护和备件预测等使用阶段应用中表现出色,但代价是模型复杂性增加,对决策者的透明度降低。对于报废阶段,未发现基于机器学习的成本估算模型,仅报告了基于路线图的方法,这表明在回收和逆向物流成本估算方面存在明显的研究空白。在所有研究中,模型质量主要使用基于方差和基于误差的指标进行评估,包括R
2、调整R
2、平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)。大多数研究强调了交叉验证对于确保泛化能力的重要性,但只有少数讨论了这些验证实践如何转化为工业成本工程环境中的持续使用。此外,仔细的特征选择和预处理被一致认为是实现稳健性能的关键推动因素。
**4.2. 综合**
综述揭示了跨模型类别和生命周期阶段的一致性能模式,从而能够为特定阶段的成本估算方法选择提供指导。基于公式的传统方法在数据稀疏条件下提供透明的基线,而机器学习模型一旦有更丰富的特征和经过验证的训练程序可用,就能提高精度。因此,早期开发阶段倾向于简单且可解释的模型,而后随着数据成熟度的提高,后期阶段受益于更复杂的学习器。在综述的数据驱动研究中,基于树的集成方法(如梯度提升)在数据丰富的生产环境中通过捕捉非线性和高维关系,始终提供最强的预测性能。回归和支持向量模型因其较低的数据需求和较高的可解释性而作为稳健的早期阶段基线,但随着系统复杂性增加而失去效力。神经网络可以达到相当的精度,但表现出更高的方差,并且需要大量的预处理和更大的数据集。未发现适用于报废阶段的基于机器学习的方法,该阶段的估算仍然是基于规则的,这突显了回收和逆向物流领域的研究空白。从方法论上看,模型性能主要由数据可用性和特征质量驱动。然而,跨研究比较因异构的评价指标而受到限制,这加强了对标准化报告的需求。总体而言,没有出现普遍优越的模型;适用性取决于开发阶段、数据成熟度以及精度与可解释性之间的所需平衡。建议将集成和混合方法用于精度驱动、数据丰富的应用,将基于回归的模型用于透明的早期估算,而神经网络仅在有足够数据基础设施的情况下使用。综合进一步表明,将结构化成本逻辑与基于学习的组件相结合,为平衡透明度和精度提供了一条稳健的途径,前提是数据集和度量标准有明确定义。这些见解通过将综述的方法映射到表3中已建立的成本估算类别中得以具体化。
综述结果的分类表明,由于缺乏所需指标,先前对传统方法的分类无法完全验证,这突显了在早期阶段进行精度驱动方法选择的局限性。对于基于机器学习的方法,使用MAPE指标作为参考。综述结果表明,机器学习模型可以实现更高的精度,前提是模型选择与开发阶段、数据成熟度以及精度与可解释性之间的所需平衡保持一致。综合表明,AACE Class 4是混合成本估算在方法上变得足够强大以用于合理用例的最早开发阶段。此时,第一个结构化设计参数可用,使得基于学习的模型能够做出贡献,同时不确定性仍然需要透明的基线逻辑。据此,提出了一个示例性的混合估算逻辑:选择参数化成本模型作为传统基线(因其数据需求低且能明确表示成本驱动因素),在学习侧,结合线性回归(作为回归模型)和XGBoost(作为基于树的集成模型),以反映在有限但不断出现的数据成熟度下的互补优势。混合估算定义为加权和,其中权重表示基于数据可用性和模型适用性的相对置信度,而非优化的预测精度。这个公式代表了从综述中得出的示例性参考配置,说明了结构化成本逻辑和基于学习的模型如何在成本估算的早期阶段被系统地结合。
**四、 讨论与结论**
**5. 讨论**
传统方法对于可解释的成本驱动因素识别以及在数据可用性和治理有限的情况下构建稀疏的早期阶段信息仍然至关重要。跨研究的证据表明,方法的有效性是阶段和数据依赖性的,而非存在普遍优越的方法。基于树的集成方法在数据丰富的生产环境中表现最佳,而更简单的回归模型由于透明度和较低的过拟合风险,在早期开发中仍更可取。类比方法在高不确定性下支持快速定位,但作为最终预测器缺乏稳健性。总体而言,研究表明,当精心策划的特征和明确的验证与现代机器学习方法相结合时,精度得到提高,但这些实践预设了成熟的数据治理和一致的数据管理,这仍然是重大的组织挑战。误差指标和验证协议的持续异质性进一步限制了跨研究的可比性。从知识角度来看,本综述提供了一个阶段和数据感知的综合,将基于机器学习的成本估算置于一个既定的分类框架内,阐明了不同估算逻辑在PSS开发中有效的条件。从实践角度看,研究结果指导成本工程师和管理者根据数据成熟度、透明度要求和决策背景调整方法选择,并警告不要过早使用复杂模型。在组织层面,结果强调了协调数据策略和标准化验证实践的必要性,以充分利用数据驱动的成本估算在整个PSS生命周期中的潜力。
**6. 结论与展望**
本文提出了一个阶段和数据感知的度量表,将机器学习置于PSS生命周期成本估算的既定估算类别中。跨综述证据表明,模型选择与项目成熟度和特征可用性相一致。当输入稀疏时,透明的参数化基线仍然有用;而一旦存在紧凑且经过验证的特征集,简单的数据驱动模型就变得有效。随着数据可用性、模型治理和流程成熟度的提高,更丰富的非线性方法获得优势。重要的是,研究结果表明,结合传统和机器学习方法可能是有益的,特别是在利用互补优势(如透明度、稳健性和预测灵活性)时。然而,系统评估哪些方法组合能在哪些生命周期阶段、数据条件和决策背景下产生有意义的协同效应,仍然是一个开放的研究任务。混合设置已经在服务中规划方面显示出附加价值,而报废估算仍未得到充分探索。所提出的度量表可作为一个部署指南,指示何时以及如何应用机器学习方法,预期哪些权衡,以及混合方法在哪些方面可能最有前景。进一步的进展可能来自于更一致的度量定义和验证协议、具有商定特征分类的共享概念阶段数据集,以及在精度之外增加对可解释性和人机交互集成的关注。将分析扩展到被忽视的生命周期阶段,并在跨领域对模型进行压力测试,对于评估泛化能力至关重要。在实践中,度量表通过将方法选择与项目定义、数据准备情况和预期用途相结合,支持更透明的规划和决策制定,同时指出了需要进一步实证评估的结合传统和机器学习方法的潜在机会。