利用先进的机器学习技术提高液化分析中的CRR（Center of Response）预测准确性

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Soil Dynamics and Earthquake Engineering》：Enhanced CRR prediction for liquefaction analysis using advanced machine learning techniques

【字体：大中小】 时间：2025年12月26日 来源：Soil Dynamics and Earthquake Engineering 4.6

编辑推荐：

　　CRR预测、机器学习集成、符号回归、液化评估、数据增强、可解释模型、地震工程、颗粒土特性、CX试验验证、模型泛化能力

　　
本文针对砂土液化评估中的关键参数——循环抗剪强度比（CRR）的预测问题，提出了一种融合集成学习、可解释性分析及符号回归的混合机器学习框架。研究团队通过系统性方法构建了包含821组实验室测试数据的基准数据库，并经过数据清洗、特征筛选和增强处理，最终在多个验证环节中展示了模型的可靠性和可推广性。

**研究背景与意义**
地震液化作为地震工程领域的核心问题，其本质是饱和无粘性土体在动荷载作用下有效应力归零的现象。传统评估方法（如应力法、应变法）多依赖现场试验数据（如标准贯入试验SPT、静力触探试验CPT），存在测试成本高、数据代表性受限、模型可解释性差等缺陷。实验室循环三轴试验（CTX）能够精确模拟地震动下的应力路径，但其数据利用率长期受限于处理技术的局限性。本研究通过机器学习方法突破传统方法的局限，重点解决以下科学问题：
1. 构建高维异构实验室数据集的标准化处理流程
2. 探索可解释机器学习在岩土工程参数预测中的应用
3. 开发融合物理先验知识的混合预测模型

**数据工程方法论**
研究团队建立了包含882组原始数据的开放数据库，涵盖砂土的物理性质（相对密度、颗粒级配）、应力状态（有效围压、动剪应力幅值）和动力响应（孔隙水压力比）等关键参数。数据预处理阶段采用了三重过滤机制：
- 物理合理性检验：剔除有效围压小于50kPa、相对密度超出30%-90%等非典型样本
- 测试方法标准化：统一不同实验室的应力路径测量规范，消除设备差异影响
- 时序一致性校验：对循环加载次数超过5000次或孔隙水压力累积速率异常的数据进行修正

通过引入10%的对抗性数据增强（包括随机噪声注入、边界值扰动、物理约束下的参数生成），有效提升了模型在极端工况下的泛化能力。特征工程阶段不仅保留原始测量参数，还通过符号回归生成了包含应力路径指数、颗粒破碎度指数等12项物理意义明确的衍生特征。

**机器学习模型架构**
研究团队创新性地构建了"解释-增强-融合"的三阶段模型架构：
1. **基准模型筛选**：通过Lazy-Predict框架对22类回归算法进行自动化评估，发现基于梯度提升的集成树模型（如XGBoost、Extra Trees）在R2值（最高达0.964）和均方根误差（最低0.022）方面表现最优，这主要得益于其强大的非线性拟合能力和对多尺度特征的自动捕捉。

2. **可解释性分析**：采用LIME方法对最优模型进行特征重要性解析，发现四个核心驱动因素：
- 循环加载次数（直接影响累积损伤）
- 相对密度（决定颗粒间咬合强度）
- 孔隙比（反映饱和状态和压缩性）
- 平均粒径（控制应力传递效率）
研究进一步发现，传统方法中占比15%的次要参数（如颗粒形状系数）通过特征组合可以提升模型解释性。

3. **符号回归增强**：运用PySR工具包对LIME识别的关键特征进行符号回归建模，成功推导出包含三个物理项的表达式：
- 应力路径敏感度因子（σ’dl/σ’vo）
- 颗粒破碎度指数（D50的倒数与粒径分布标准差乘积）
- 循环次数对密实度的修正项
这些由物理机制指导生成的衍生特征，使模型在保持高预测精度的同时，解释性提升达40%（通过SHAP值分析验证）。

**混合模型构建与验证**
研究提出XGBoost+PySR的混合架构，其创新点在于：
- **特征融合层**：将符号回归生成的3个物理特征（占比15%）与原始7个特征（占比85%）进行动态加权组合
- **可解释性增强**：通过SHAP值对特征贡献进行可视化排序，发现D50和σ’dl的交互作用对模型输出的影响权重达到27%
- **实时修正机制**：在模型推理阶段引入孔隙水压力动态反馈模块，根据当前应力状态实时调整预测值

模型验证采用双盲测试策略：将历史地震案例（如1995年阪神地震的5组典型样本）的数据分为训练集（80%）和测试集（20%），最终在验证集上实现：
- XGBoost基线模型R2=0.892（RMSE=0.039）
- 混合模型R2=0.964（RMSE=0.022）
- 误差分布符合正态分布（标准差0.008）
在六个典型场地的实测数据验证中，模型预测值与实测值的偏差控制在±7.3%以内，显著优于传统经验公式的±15%误差范围。

**工程应用价值**
该框架为抗震设计提供了新的方法论：
1. **全生命周期预测**：从实验室数据到现场应用，实现从微观力学响应到宏观工程评估的贯通
2. **风险分级系统**：基于CRR预测值可构建五级液化风险矩阵，为工程分级提供量化依据
3. **动态监测优化**：通过实时反馈机制，可在强震发生时动态调整预警阈值

研究特别强调模型的可移植性，在验证阶段发现：
- 日本关东平原砂土（D50=0.28mm）与印度阿萨姆邦砂土（D50=0.35mm）的模型性能差异仅为2.1%
- 高频次循环加载（>2000次）场景下，混合模型仍保持98.7%的准确率
- 对不同密实度（30%-85%）的砂土样本预测误差标准差不超过0.006

**技术贡献与行业影响**
本文的突破性进展体现在三个层面：
1. **数据科学层面**：建立了首个包含实验室参数-现场观测数据的基准测试集，覆盖7种主要测试方法
2. **算法创新层面**：开发出融合物理符号回归与集成学习的混合架构，在SCI期刊中首次将PySR工具包应用于岩土工程预测
3. **工程实践层面**：为《建筑抗震设计规范》（GB50011-2010）提供了新的参数计算范式，在2023年日本抗震设计修订中已被纳入参考案例

研究团队还开发了开源代码库（GitHub：CRR-Prediction-Hybrid），包含：
- 自动化特征工程工具包
- 可视化解释性分析平台
- 多场地验证基准测试集
该工具包已在3个国际岩土工程竞赛中获得最佳实践奖

**结论与展望**
本研究验证了机器学习在解决岩土工程复杂问题中的潜力，但仍有改进空间：
1. 拓展数据维度：建议增加地震动频谱特性（如0.5-2Hz能量占比）作为输入参数
2. 混合现实应用：开发AR可视化模块，实时展示液化风险分布云图
3. 动态更新机制：构建基于数字孪生的模型迭代系统，实现参数库的自动更新

研究团队正在与日本国土交通省合作，将模型集成到智能预警系统中。初步测试显示，该系统可使液化评估的决策时间从平均4.2小时缩短至15分钟，同时将误报率降低至0.7%以下，预计在2030年前可应用于全球20%的地震高风险区。

联系信箱：

粤ICP备09063491号

热点排行