约旦建筑风险可解释机器学习研究:混合方法证据、GA优化聚类与高精度预测
《Results in Engineering》:Explainable Machine Learning for Construction Risk in Jordan: Mixed-Methods Evidence, GA-Optimized Clustering, and High-Accuracy Prediction
【字体:
大
中
小
】
时间:2025年11月01日
来源:Results in Engineering 7.9
编辑推荐:
本研究针对约旦建筑项目面临持续的成本、进度、质量和安全风险问题,开发了一种结合混合方法、遗传算法(GA)优化K-means聚类和多种监督机器学习模型(随机森林、梯度提升树、Extra Trees分类器)的可解释机器学习(ML)管道。研究通过对200名从业者调查和15位专家访谈,识别出19个关键风险因素,其中设计质量、领导力有效性、不利天气、法规合规性和融资稳定性最为关键。模型预测准确率高达93.2%,并通过SHAP分析提供可解释的预测结果,为约旦建筑行业提供了数据驱动的风险预警和决策支持模板,对类似市场的风险管理具有重要参考价值。
在约旦这个建筑业占国内生产总值5.3%的国家,建筑项目长期面临着进度延误、成本超支、质量问题和安全隐患等多重挑战。传统风险管理方法主要依赖定性分析和经验判断,难以应对复杂项目中相互交织的风险因素。尽管先前研究已识别出数十种风险因素,如Hiyassat等人发现的62种影响公共建筑项目的风险,但如何系统性地量化这些风险、预测其影响并制定针对性措施,仍然是行业面临的重大难题。
在这一背景下,约旦耶尔穆克大学的研究团队在《Results in Engineering》上发表了一项创新研究,他们开发了一套结合混合研究方法、遗传算法优化聚类和高精度预测模型的可解释机器学习管道,专门针对约旦建筑行业的特殊环境量身定制。
为了开展这项研究,研究人员采用了三阶段混合方法设计。第一阶段通过问卷调查收集了200名建筑专业人士的数据,同时进行了15场专家访谈;第二阶段使用SPSS和Python进行统计分析,包括相对重要性指数(RII)、方差分析(ANOVA)和主题分析;第三阶段则重点开发机器学习模型,包括GA优化的K-means聚类、随机森林(RF)、梯度提升树(GBT)和Extra Trees分类器。研究还采用了分层5折交叉验证和80/20的数据分割策略来评估模型性能。
研究首先通过Cronbach's α系数验证了问卷工具的可靠性,各维度α值在0.794-0.882之间,表明工具具有良好信度。相对重要性指数分析显示,排名前五的风险因素分别是:设计错误和质量问题(RII=0.865)、领导力有效性(RII=0.851)、不利天气条件(RII=0.850)、建筑法规合规性(RII=0.834)和融资稳定性(RII=0.828)。方差分析进一步证实了这些风险因素对项目绩效有显著影响(p<0.05)。
研究人员采用遗传算法优化K-means聚类,通过轮廓系数、Davies-Bouldin指数和Calinski-Harabasz指数确定最佳聚类数为4。GA优化后的轮廓系数从传统的0.565提升至0.59,表明聚类效果显著改善。聚类分析将建筑公司分为四类:极高风险集群(小型公司、经验不足)、高风险集群、中等风险集群和低风险集群(大型公司、经验丰富)。这一分类帮助识别了不同规模和经验水平的公司面临的特有风险模式。
在预测模型方面,随机森林表现最佳,测试准确率达到93.2%,精确度0.892,召回率0.908,F1分数0.900。梯度提升树和Extra Trees分类器也分别达到了92.5%和90.0%的准确率。特征重要性分析和SHAP值解释表明,设计质量、领导力有效性、天气暴露、法规合规性和融资稳定性是影响项目绩效的关键预测因子。特别值得注意的是,领导力显示出保护性效应,而设计和天气因素则会放大风险。
定性分析通过主题分析深入探讨了定量结果的背后原因,识别出实施风险管理的主要挑战包括资金支持不足、传统风险评估复杂性以及缺乏对风险管理益处的认识。访谈结果与定量发现相互印证,为制定针对性干预措施提供了深刻见解。
研究结论表明,该可解释机器学习管道能够有效识别、分类和预测约旦建筑项目的关键风险。通过将调查数据转化为可操作的决策支持,研究克服了传统风险识别与主动缓解之间的差距。特别是在监管、金融和环境约束并存的背景下,该方法为资源有限的环境提供了实用的风险管理解决方案。
讨论部分强调,本研究的主要意义在于将先进的机器学习技术与具体的行业背景相结合,开发出既具有高预测精度又具备良好可解释性的风险评估工具。领导力作为保护性因素、设计缺陷和不利天气作为风险放大器的发现,为项目管理提供了明确的改进方向。针对不同风险集群的定制化干预策略,使各种规模的公司都能找到适合自身情况的风险管理方案。
该研究的局限性包括样本主要来自安曼和伊尔比德地区,且偏向中大型公司,自我报告数据可能存在共同方法偏差。未来研究可扩展至更多地区,并进行时间序列验证以进一步增强模型的普适性和稳健性。
总体而言,这项研究为约旦乃至类似发展中国家的建筑行业提供了切实可行的风险管理框架,通过数据驱动的方法提升了项目成功率,对促进行业可持续发展具有重要意义。研究成果不仅具有学术价值,更具备显著的实践应用前景,为建筑项目的科学管理提供了新范式。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号