可解释的机器学习与生成扩散模型在改进降雨引发的群发性滑坡易发性制图中的应用:以中国东南部吴平县为例

《Computers and Geotechnics》:Explainable machine learning and generative diffusion modeling for improved susceptibility mapping of rainfall-induced clustered landslides: A case study from Wuping County, southeastern China

【字体: 时间:2026年03月02日 来源:Computers and Geotechnics 6.2

编辑推荐:

  降雨引发的多因素耦合滑坡易发性评估方法研究。采用Wuping县2024年极端降雨事件数据,构建12.5米分辨率空间数据库,整合11类地质环境因子。通过结构化降雨分析揭示"累积雨量-短时暴雨脉冲"双触发机制,比较6种机器学习模型,引入扩散概率模型进行数据增强,使XGBoost模型AUC从0.915提升至0.931(p<0.01)。建立可解释-生成混合框架,结合信息增益比与SHAP值解耦多因素耦合机制,为东南山区滑坡风险评估提供新方法。

  
黄宇|李英克|黑丽莎|邹家玲|陈定宇
同济大学土木工程学院地质与水利工程系,上海200092,中国

摘要

由降雨引发的群发性滑坡在中国东南部越来越频繁,其特点是多因素的强烈耦合,对当地社区和基础设施构成了重大威胁。以福建省武平县为例,本研究对2024年6月15日至16日极端降雨引发的6,005次浅层滑坡进行了灾后统计。同时生成了等数量的非滑坡样本,并将地形、地质、水文、植被和人为因素汇编成一个12.5米分辨率的数据集(训练/测试比例为7:3)。基于站点观测的降雨数据,结构降雨分析表明,滑坡的群发是由“前期降雨积累”和“短时高强度脉冲”两种机制共同引发的。进行了全面的因素质量评估,包括多重共线性分析(VIF < 5,TOL > 0.1)和皮尔逊相关性筛选,以确认建模前条件因素的独立性和可靠性。随后开发并比较了六种模型——SVC-GridSearch、SVC-Bayes、SVC-GWO、SVC-PSO、随机森林和XGBoost,并使用SHAP分析来提高可解释性,并通过IGR结果进行交叉验证。XGBoost模型在测试集上取得了最佳性能(AUC约为0.915)。为了解决类别边界的模糊性,进一步引入了去噪扩散概率模型(DDPM)对11维因素空间进行控制数据增强,生成了约12%位于模型“混淆区”内的目标样本(预测概率为0.45–0.55)。增强后,XGBoost的AUC提高到了约0.931,DeLong检验结果显著(p < 0.01),灵敏度提高,置信区间变窄。这种可解释机器学习与生成概率模型的混合框架在样本有限的情况下有效提高了易发性绘制的准确性,为东南部山区的风险评估、应急控制和缓解规划提供了技术支持。

引言

降雨引发的滑坡群发是山区最具破坏性的地质灾害之一,其影响在中国东南部尤为明显(Yang等人,2025年;Yi等人,2025年)。随着极端天气和气候事件的加剧,滑坡的动态演变和时空不确定性变得越来越明显(Capobianco等人,2025年;Chen等人,2025年;Huang等人,2024b年,2024a年)。此类事件往往在短时间内触发数千次斜坡失稳,对人类生命、基础设施安全和区域可持续性构成严重威胁(He等人,2025年;Ma等人,2025年;Yi等人,2025年)。例如,2024年4月,福建省武平县的一次极端降雨事件在24小时内引发了6,000多次滑坡,对道路、村庄和农田造成了广泛破坏。这些大规模的斜坡失稳凸显了在多因素耦合条件下增强滑坡易发性科学理解和定量评估的迫切需求(He等人,2024年;Pokharel等人,2021年;Tang等人,2020年)。
在中国东南部的山区,强烈的岩石风化和显著的地形起伏导致了降雨引发的浅层滑坡,这些滑坡表现出显著的时间聚集性和多因素耦合特征(Fu等人,2025年;Ma等人,2023年;Zhang等人,2022年)。理解地形、地质、水文、降雨过程、植被和人为工程活动之间的协同机制已成为地质灾害研究的重要方向(Fei等人,2025年;Villa?a等人,2024年;Wu等人,2025a年)。传统的滑坡易发性绘制方法通过将多个因素纳入统计和机器学习模型取得了显著进展(Alvioli等人,2024年;Bezak等人,2019年;Fran?a Pereira等人,2023年)。然而,这些方法通常依赖于线性假设或过于简化的因素相互作用(Capobianco等人,2025年;Huang等人,2024a年),这限制了它们捕捉多个条件因素之间复杂耦合的能力。此外,大多数现有模型将降雨视为单一指标,如总降水量或最大强度,而忽略了其内部结构特征,包括降雨量、短时强度脉冲和降雨偏度,这些因素共同决定了浅层斜坡失稳的时间和时空响应(Wu等人,2025b年;Zhang等人,2025年;Zhao等人,2025年)。近年来,可解释机器学习框架,如信息增益比率(IGR)和SHAP(Shapley加性解释),为量化条件因素的相对重要性和非线性响应提供了新途径,从而建立了统计贡献与物理机制之间的直接联系(Kasahun等人,2025年;Sun等人,2024年;Wang等人,2024年)。
此外,生成模型在捕捉复杂数据分布方面展现了非凡的潜力(Ravuri等人,2021年;Wen等人,2024年;Yang等人,2024年)。其中,去噪扩散概率模型(DDPM)可以通过迭代去噪和逆过程有效地学习高维噪声数据中的分布结构(Ho等人,2020年;Yang等人,2024年)。与传统方法不同,DDPM不仅保留了样本的边际分布特征,还捕捉了变量之间的复杂依赖关系(Ramirez-Jaime等人,2025年;Song等人,2020年),使其在模拟降雨引发的滑坡的随机背景方面具有固有的优势。同时,它可以生成与真实分布一致的虚拟样本,从而缓解数据稀缺问题并提高预测模型的泛化能力(Feng等人,2024年;Yang等人,2024年)。然而,DDPM在地质灾害研究中的应用仍处于早期阶段,特别是在将生成建模与可解释机器学习结合用于空间易发性评估方面(Xu等人,2025年)。其在减轻样本稀疏性和揭示多因素耦合机制的同时保持地球物理可解释性的潜力仍需进一步探索(Xu等人,2024年)。
因此,本研究提出了一个可解释-生成的混合框架,用于评估降雨引发的群发性滑坡。使用来自福建省武平县的多元数据,引入了三个降雨结构指标(最大小时强度、偏度和丰度)。使用了多种机器学习模型,包括支持向量分类(SVC,通过贝叶斯优化进行优化)、灰狼优化器(GWO)、粒子群优化(PSO)、随机森林(RF)和XGBoost,并在基于DDPM的数据增强前后比较了性能。所提出的框架结合了生成能力和可解释性,为在数据有限和复杂因素相互作用的情况下评估浅层滑坡易发性提供了实用方法。

研究区域

研究区域位于福建省西南部(图1),中国东南部,地处福建省、广东省和江西省的交界处。它位于武夷山脉南部边缘到沿海丘陵平原的过渡带,介于东经115°51′–116°23′和北纬24°47′–25°29′之间。地形主要为山地和丘陵,从西北向东南整体海拔逐渐降低,海拔大多在200米左右。

总体工作框架

本研究采用的方法论框架遵循一个渐进的建模策略,包括七个主要阶段,如图7所示。
  • 1.
    通过整合滑坡清单、非滑坡样本以及来自地形、地质、水文、环境和岩土工程来源的十一个条件因素,构建了一个空间数据库。所有栅格数据被重新采样到统一的12.5米空间分辨率,并进行了标准化以确保一致性。
  • 2.
    为了确保数据
  • 变量分析

    在进行滑坡易发性建模之前,有必要检查条件因素之间的相互关系,以避免由于多重共线性导致的不稳定性和偏见解释。在本研究中,使用了方差膨胀因子(VIF)和容忍度(TOL)统计量来评估选定变量之间的多重共线性,如图10所示,并进一步进行了皮尔逊相关性分析以评估它们的成对线性关联。

    多因素耦合下的可解释解耦机制

    基于结合IGR和SHAP值的双层解释框架,本研究定量解耦了控制滑坡易感性的主要条件因素和耦合机制。IGR提供了因素重要性的整体排名,而SHAP进一步揭示了每个因素在样本尺度上的响应方向,从而建立了统计相关性和物理机制之间的可追溯映射。结果表明,软化

    结论

    本研究提出了一个综合的、数据驱动的框架,用于评估武平县降雨引发的滑坡易感性,结合了因素质量控制、多种智能模型比较、可解释学习和基于扩散的数据增强。主要结论如下:
  • 1.
    通过合并滑坡清单、非滑坡对照样本和十一个统一为12.5米分辨率的条件因素,构建了一个空间一致的数据库。
  • 作者贡献声明

    黄宇:撰写 – 审稿与编辑、验证、监督、资源管理、项目管理、方法论、资金获取、概念化。李英克:撰写 – 原始草稿、可视化、验证、软件、方法论、正式分析、数据管理、概念化。黑丽莎:验证。邹家玲:数据管理。陈定宇:验证。

    利益冲突声明

    作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

    致谢

    本研究得到了国家重点研发计划(2024YFC3012600)的支持。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号