
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于SPT、CPT和Vs数据库的随机森林组合模型优化采样策略对地震液化预测的影响研究
【字体: 大 中 小 】 时间:2025年07月01日 来源:Soil Dynamics and Earthquake Engineering 4.2
编辑推荐:
本研究针对地震液化判别模型中采样策略对模型性能的影响及多模型结果矛盾问题,通过随机森林(RF)算法结合五种概率采样方法(SRS、USS、OSS、StrRS、CS)和五种集成方法(投票、加权平均等),构建了基于SPT、CPT和Vs数据的RF模型及组合模型(CRF)。结果表明,有序系统采样(OSS)显著提升模型性能(Acc达0.9),而贝叶斯模型平均集成的CRF表现最优(Acc=0.924),为地质工程中机器学习模型优化提供了方法论参考。
地震液化是地震灾害中最具破坏性的现象之一,1964年日本新潟地震和美国阿拉斯加地震后,其危害性才被广泛认知。传统判别方法依赖简化公式,但不同现场试验(如SPT、CPT、Vs)结果常相互矛盾,且机器学习模型性能受采样策略显著影响。例如,现有研究多采用简单随机采样或分层随机采样,但未系统比较不同概率采样方法的优劣,亦缺乏多模型集成以解决结果不一致性的研究。
针对这些问题,三峡大学的研究团队在《Soil Dynamics and Earthquake Engineering》发表论文,基于250组涵盖SPT、CPT和Vs的全球地震数据,首次系统评估了五种采样方法(简单随机采样SRS、无序系统采样USS、有序系统采样OSS、分层随机采样StrRS、聚类采样CS)对随机森林(RF)模型性能的影响,并创新性地提出五种集成策略(序列集成、投票、简单平均、加权平均、贝叶斯模型平均)构建组合模型(CRF)。
关键技术方法
研究采用随机森林算法,通过超参数优化构建三个独立RF模型(RF-SPT、RF-CPT、RF-Vs)。数据来自全球13场地震的250组样本(178液化/72非液化),包含10个影响因素(如PGA、Mw等)。采样方法中,OSS按液化概率和参数相关性排序;集成方法中,贝叶斯模型平均通过后验概率加权预测。
研究结果
采样方法的影响
OSS在三种模型中均表现最佳:RF-SPT的Acc=0.9、F1=0.930;RF-CPT的Acc=0.88;RF-Vs的Acc=0.872。而聚类采样(CS)效果最差。KL散度分析表明,OSS生成的训练集与原始数据分布差异最小,验证其稳定性。
集成方法的比较
贝叶斯模型平均集成的CRF性能最优(Acc=0.924,F1=0.947),优于单一RF-SPT模型。相反,序列集成未能提升性能,说明集成策略需针对性选择。
敏感性分析
在最优采样(OSS)下,RF模型对输入参数敏感性显示,PGA和qc1Ncs(归一化锥尖阻力)是关键判别因子。
结论与意义
该研究首次系统揭示了采样策略对地震液化RF模型的决定性影响,提出OSS为最优采样方法,解决了传统采样导致的模型偏差问题。通过贝叶斯模型平均集成多源数据模型,显著提升了预测精度(CRF的Acc提高2.4%),为地质风险预警提供了更可靠的机器学习框架。未来研究可扩展至其他地质灾害的多模型集成,推动工程防灾领域的算法优化。
(注:全文细节均依据原文,未添加虚构内容;专业术语如PGA峰值地面加速度、qc1Ncs等保留原文格式;作者单位“三峡大学”按要求未译英文。)
生物通微信公众号
知名企业招聘