《Results in Engineering》:Predicting Costs in Modular Construction: A Comprehensive Study Using SSA and SVR Combined Models
编辑推荐:
本文针对装配式建筑成本预测中数据样本小、特征维度高、传统方法精度不足的问题,提出一种结合随机森林(RF)特征选择和麻雀搜索算法(SSA)优化支持向量回归(SVR)的混合预测模型(RF-SSA-SVR)。研究通过10折交叉验证表明,该模型平均绝对误差(MAE)低至0.13266,均方根误差(RMSE)为0.18420,预测相对误差满足可行性研究阶段投资估算±20%的精度要求,为装配式建筑投资决策提供了可靠技术支撑。
在绿色建筑浪潮席卷全球的背景下,装配式建筑以其节能环保、高效施工的显著优势,成为传统现浇建筑的重要替代方案。然而,这片新兴蓝海却暗藏险滩——高昂的初始投资成本与失准的成本预估,犹如两座大山阻碍着行业规模化发展。由于我国装配式建筑发展历史较短,缺乏完善的历史项目数据库,加之其成本结构、生产工艺与传统建筑存在显著差异,使得早期投资决策常陷入"盲人摸象"的困境。更棘手的是,现有深度学习等方法通常需要海量高质量数据支撑,而装配式建筑项目恰恰具有样本量少、特征维度高的典型特点,这种"小样本、高维度"的数据特性让传统成本预测模型频频失灵。
面对这一行业痛点,Fuqin Liu团队在《Results in Engineering》上发表了创新性研究成果。研究者们独辟蹊径,将工程学领域的智能算法与建筑工程管理深度融合,构建了一套名为RF-SSA-SVR的混合预测框架。该研究的精妙之处在于采用了"分步击破"的策略:首先运用随机森林(Random Forest, RF)这把"智能筛子"从16个工程特征中精准筛选出8个最关键的成本驱动因素,包括建筑面积、预制构件价格、钢筋价格等核心指标;然后引入麻雀搜索算法(Sparrow Search Algorithm, SSA)这支"调音师团队",对支持向量回归(Support Vector Regression, SVR)模型的超参数进行智能调优,有效解决了传统人为参数设置的盲目性问题。
关键技术方法主要包括:基于RF的特征重要性排序与最优特征子集选择、SSA超参数优化算法(优化SVR的惩罚系数C和核函数参数γ)、10折交叉验证的模型评估框架,以及MAE、MSE、RMSE和R2等多指标性能评价体系。研究收集了2019-2024年间中国湖北、广东等地的46个装配式住宅项目数据作为样本队列。
研究结果
特征选择效果显著
通过RF算法计算出的特征重要性排名显示,建筑面积、预制构件价格等8个特征对成本预测贡献度最高。当特征数量从16个精简至8个时,模型性能达到峰值,分类准确率提升至93.5%,Kappa系数达0.9236,证明特征选择有效消除了冗余信息的干扰。
参数优化提升模型性能
SSA算法在SVR超参数优化中展现出显著优势。与遗传算法(GA)和灰狼优化器(GWO)相比,SSA优化的RF-SSA-SVR模型在10折交叉验证中各项指标均最优:MAE(0.13266)、MSE(0.06840)和RMSE(0.18420)明显低于对比模型,且R2达到0.99701,表明其具有极佳的拟合优度。
预测精度满足工程要求
案例层面的预测结果显示,RF-SSA-SVR模型的相对误差基本控制在10%以内,最大不超过8.62%,远低于可行性研究阶段20%的误差允许范围。这意味着该模型能够为项目前期投资决策提供可靠依据。
研究结论与意义
本研究成功构建的RF-SSA-SVR混合模型,为解决装配式建筑小样本成本预测难题提供了创新解决方案。通过RF特征选择降低了数据维度,利用SSA优化提升了SVR的泛化能力,最终实现了在有限数据条件下的高精度预测。相比传统方法,该模型不仅预测误差显著降低,且具有更好的稳定性和鲁棒性。
这项研究的工程应用价值尤为突出:一方面,其为装配式建筑项目前期投资控制提供了科学工具,有助于降低投资风险;另一方面,建立的特征体系为行业成本管理指明了关键控制点。随着我国装配式建筑的持续推广,这种数据驱动的新型预测方法将在地下工程、桥梁建设等同样面临小样本预测挑战的领域产生示范效应。尽管当前样本量有限,但随着行业数据积累,该框架有望进化为更精准的智能决策系统,为建筑产业现代化注入新动能。