《Soil Dynamics and Earthquake Engineering》:Optimized prediction of peak floor acceleration, peak inter-story drift ratio, and residual inter-story drift ratio in steel moment-resisting frames using innovative techniques
编辑推荐:
机器学习模型与优化算法结合预测建筑地震响应参数PIDR、PFA、RIDR,通过特征选择和离群点检测提升模型性能,并验证了混合模型(如RFPO、HGPO、RFMO)在R2和RMSE指标上的优越性。
张鹏|王少鹏|张淑娜
河北职业技术学院建筑工程系,邢台,054000,河北,中国
摘要 建筑行业需要精确预测建筑物的地震响应。地震分析中评估的关键指标包括层间位移比(PIDR)、楼层峰值加速度(PFA)和残余层间位移比(RIDR)。本研究的目标是基于机器学习对这些参数进行预测,因此采用了多种机器学习算法和优化算法。决策树回归(DTR)、弹性网络回归(ENR)、直方图梯度提升(HGBR)和随机森林回归(RFR)是所使用的模型,而蛾焰优化(MFO)、鹦鹉优化器(PO)和贝叶斯优化器(BO)则用于构建混合模型,以提高单个模型的性能。为了优化计算过程并减少运行时间,实施了基于递归特征消除(RFE)和Z分数技术的特征选择和异常值检测。预测结果通过五个统计指标进行评估,包括决定系数(R2 )、均方根误差(RMSE)、相对绝对误差(RAE)、95%不确定性区间(U95 )、平均归一化偏差(MNB)和平均绝对百分比误差(MAPE)。此外,还展示了所有模型的运行时间,并通过FAST和SHAP方法分析了输入对目标值的影响。根据测试阶段的结果,RFPO(RFR + PO)在R2 和RMSE方面的性能分别为0.9921和1.036,是所有模型中最好的混合模型。对于PIDR,HGPO(HGBR + PO)的表现更好,其R2 和RMSE分别为0.9652和0.0007。另一方面,对于RIDR,表现最好的模型是RFMO,其R2 值为0.9956,RMSE值为0.00001。
引言 准确预测建筑物结构对地震活动的响应对于地震设计和评估至关重要,这是全球范围内广泛研究的重要领域。地震分析中测量的一些最重要的响应指标包括层间位移比(PIDR)、楼层峰值加速度(PFA)和残余层间位移比(RIDR)。PIDR表示地震期间两层建筑物之间的最大相对位移,是连接地震响应与结构受损程度的一个关键工程因素。PIDR越大,非结构部件(如隔墙、窗户和天花板)受损的可能性就越高。PIDR对于评估结构损伤也非常重要,用于判断建筑物是否能够继续使用或是否会经历显著变形[1]。PFA表示楼层在地震期间所承受的最大加速度[2],而RIDR反映了建筑物由于侧向荷载而产生的永久性变形[3]。近年来,许多研究通过机器学习技术对这些参数进行了预测[[4], [5], [6], [7]]。孙等人[8]概述了机器学习在建筑设计中的作用;他们展示了机器学习如何应用于建筑设计领域,表明ML模型可以帮助预测结构性能、确定结构状况,并通过分析来自不同来源和渠道的数据来指导主动和恢复措施。
Mori等人[9]开发了一个高斯过程回归模型,根据地面运动参数和建筑物的脆弱性来预测屋顶峰值位移比。胡等人[10]提出了一种基于位移的钢框架设计方法,该方法考虑了峰值位移和残余位移,并利用机器学习技术来预测非弹性位移比。Asgarkhani等人[11]应用机器学习技术来预测钢框架(SMRFs)的PIDR。其中效果最好的模型是XGBoost、随机森林(RF)、贝叶斯岭回归(BR)和额外树回归(ETR)。这些方法比传统的地震脆弱性评估方法更高效、更精确,具有节省时间和计算资源的潜力。Noureldin等人[12]提出了一个机器学习框架,用于根据非线性时程分析的数据集对结构的服务性能进行设计评估。Junda等人[13]研究了用于估算交叉层压木结构层间位移和屋顶位移的机器学习模型。他们提出了一种使用时变模型和贝叶斯滤波器估算结构最大层间位移比(IDR)的方法。时变模型参数在地震期间根据高斯分布随机变化,以捕捉真实结构的变化刚度和阻尼特性。然后,将时变模型与状态空间中的贝叶斯滤波器结合使用,以计算最大IDR。
Bojorquez和Ruiz-García[14]使用窄带地面运动记录评估了抗弯钢结构的RIDR;他们发现超过0.5%的RIDR值表明对居住者来说是不安全的条件。Mahdavipour和Deylami[15]建立了应变硬化比率与抗屈曲约束框架(BRBFs)的RIDR要求之间的联系。此外,许多研究者指出,在新结构的设计[16], [17], [18]以及评估建筑物的地震韧性[19], [20], [21], [22]中,预测残余位移需求是一个关键方面。Alehojjat等人[23]研究了带有流体粘性阻尼器(FVDs)的中层钢结构对RIDR的需求,并使用改进的DDBD方法进行了设计。为此,探讨了三种近似方法适用于RIDR需求估算的适用性:FEMA P-58、Erochko等人的方法以及系数方法。这些方法最初是为没有阻尼器的抗弯框架(MRFs)开发的。
E等人[24]提出了一种方法,用于预测表现出弹性或半弹性行为的建筑物的加速度需求。该方法通过将计算出的楼层峰值加速度需求、加速度时程和来自六栋受地震影响的高层建筑的数据进行比较来进行评估。Lukas Moschen和Christoph Adam[25]专注于预测地震弹性结构的中位数峰值楼层总加速度(PFA)需求。该预测依赖于一系列不同复杂性的响应谱技术。从新提出的完全二次组合(CQC)规则开始,研究了模态贡献、峰值因子和交叉谱矩之间的相互关系,从而提出了新的模态组合规则。Mohsenian等人[26]提出了一种新方法,用于估算建筑物在地震中非结构部件将经历的摇晃加速度。该方法利用了两个新参数,这些参数来自局部地震危险性和建筑物结构系统的强度。新方法的一个优点是在计算非结构部件的需求时考虑了地震危险性的程度以及结构可能的表现程度。
本研究的新颖之处在于开发了一个机器学习框架,能够在集成优化流程中准确预测所有三个关键的地震需求参数,包括层间位移比(PIDR)、残余层间位移比(RIDR)和楼层峰值加速度(PFA)。与通常使用具有固定超参数和有限可解释性的独立ML模型的先前研究不同,本研究引入了一种集成混合建模策略,结合了四种基线回归器(ENR、DTR、HGBR和RFR)和三种互补的优化算法——鹦鹉优化器(PO)、蛾焰优化(MFO)和贝叶斯优化器(BO)。选择这些优化器是为了捕捉不同的搜索行为:PO用于高效探索高维空间,MFO用于强全局搜索和避免过早收敛,BO用于概率性、样本高效的超参数调整。在本研究中,“混合模型”一词指的是通过这些优化器系统调整超参数的基线算法的优化形式,以提高预测准确性和鲁棒性。该方法的新颖性还通过结合两种互补的敏感性分析技术得到了进一步加强——FAST用于基于方差的全局影响分析,SHAP用于局部、模型驱动的可解释性分析——提供了对参数效应的透明和全面的理解。此外,工作流程包括使用RFE进行特征选择和通过Z分数进行异常值检测,然后使用5折交叉验证对原始数据和预处理后的数据进行比较评估,以评估预处理对模型稳定性的影响——这是现有地震ML研究中很少考虑的方面。模型性能使用一系列工程相关指标进行评估(
R 2 U 95 U 95 U 95 U 95 U 95 U 95 U 95 U 95 U 95 U 95 U 95 U 95 U 95 U 95 U 95 U 95 U 95 决策树回归(DTR) 决策树回归是一种基于树的模型,用于预测因变量的数值结果。它也被称为M5P算法,是Quinlan的M5算法的具体实现[27]。与CART(分类和回归树)类似,M5P也表示一种基于树的结构;然而,与CART不同的是,M5P树的叶子节点包含多变量线性模型。
数据描述 共设计了621个具有不同几何配置和加载场景的特殊钢框架(SMRFs),设计符合ASCE 7-16和AISC 341/360规范[[37], [38], [39], [40], [41]]。设计空间反映了高地震活跃地区的典型办公建筑——具体来说是加利福尼亚州洛杉矶的D类场地条件,其谱参数为Ss = 2.25 g和S1 = 0.60 g。
原型集包括1层、5层、9层和14层的结构。
数据预处理 在本研究中,实施了一个全面的预处理流程,以提高数据质量并增强基于机器学习的地震响应预测的可靠性。该流程包括三个连续组件:特征选择、异常值检测和应用于单个及混合模型的五折交叉验证。特征选择使用递归特征消除(RFE)[55]进行,以分离最具影响力的结构和地震预测因子。
超参数调整 超参数是控制机器学习模型训练方式的参数。与从数据中学习的模型参数不同,超参数在训练过程之前就预先设置,并显著影响模型的性能。采用各种策略处理超参数以最大化模型性能。随机搜索在Python代码中被证明是一种非常有效的技术。基于机器学习的地震预测的局限性 机器学习在地震工程中越来越频繁地被用来预测工程需求参数(EDPs),从而实现更快的评估和更高的自动化。然而,仍然存在重大障碍;其中一个主要挑战是缺乏多样化的、高质量训练数据,因为真实的地震记录很少见,而模拟数据可能无法准确反映真实的结构行为。训练数据中存在的偏差会降低各种预测的准确性。结论 本研究的目的是利用机器学习来预测地震参数;因此,应用了多种机器学习算法和优化技术。使用了决策树回归(DTR)、弹性网络回归(ENR)、直方图梯度提升(HGBR)和随机森林回归(RFR)等模型,而蛾焰优化(MFO)、鹦鹉优化器(PO)和贝叶斯优化器(BO)则作为优化器,用于创建各种混合模型。
CRediT作者贡献声明 张鹏: 撰写 – 审稿与编辑,撰写 – 原稿,监督,软件,项目管理,概念化。王少鹏: 撰写 – 审稿与编辑,撰写 – 原稿,验证,软件,方法论,资金获取,数据管理。张淑娜: 撰写 – 审稿与编辑,撰写 – 原稿,验证,软件,资源,方法论,形式分析。
利益冲突声明 作者声明他们没有已知的可能会影响本文所述工作的竞争性财务利益或个人关系。