《International Journal of Coal Science & Technology》:Mapping unit selection in landslide susceptibility prediction: A comprehensive explainable framework integrating multi-method interpretability
编辑推荐:
当前针对揭示不同制图单元下机器学习模型在滑坡敏感性中的相似性与差异性研究, frequently 仅采用精度评价方法, yet 对可解释性的深入探索甚少。此外,单一类型可解释方法在适用性方面存在局限,且其解释能力不够全面。为应对这些挑战,本研究提出了一种综合可
当前针对揭示不同制图单元下机器学习模型在滑坡敏感性中的相似性与差异性研究, frequently 仅采用精度评价方法, yet 对可解释性的深入探索甚少。此外,单一类型可解释方法在适用性方面存在局限,且其解释能力不够全面。为应对这些挑战,本研究提出了一种综合可解释性框架,以揭示机器学习模型在不同制图单元下滑坡敏感性预测(Landslide Susceptibility Prediction, LSP)的内在机制。研究选取平阳县作为案例,首先筛选了16项滑坡环境因子与225个滑坡样本。随后,分别构建基于斜坡单元与格网单元的随机森林(Random Forest, RF)模型进行LSP。最后,提出一种综合可解释性方法,用以分析不同机器学习模型对LSP的可解释性。该方法涵盖基于均方误差(Mean Squared Error, MSE)的特征重要性分析、基于部分依赖图(Partial Dependence Plot, PDP)与个体条件期望(Individual Conditional Expectation, ICE)方法的单特征分析、基于受试者工作特征曲线下方面积(Area Under the receiver operating characteristic Curve, AUC)的交互分析,以及以探索性方式对个体样本进行全特征Shapley可加性解释(Shapley Additive exPlanations, SHAP)值分析。结果表明:(1)两种模型的AUC精度均达到0.9以上,表明预测精度较高。综合可解释性方法揭示,斜坡单元-RF模型的LSP结果与地质数据更为吻合;(2)两种模型中环境因子重要性相似,但斜坡单元-RF模型中地形湿度指数(Topographic Wetness Index, TWI)与归一化植被指数(Normalized Difference Vegetation Index, NDVI)的影响更大。本研究通过综合单样本全特征SHAP值分析揭示,斜坡单元-RF模型对个体样本表现出更大的SHAP值。结合真实案例研究,可解释性结果分析表明该模型在斜坡单元框架内地形评估中的预测更为可靠。
滑坡作为一类关键的地质灾害,可在多种气候条件下发生,导致重大人员伤亡与经济损失。中国属于滑坡事件频发国家,由此造成了 substantial casualties 与 significant economic losses。值得注意的是,滑坡具有高隐蔽性与广空间分布特征,现有数据库中约70%的滑坡点尚未被记录。因此,识别潜在滑坡易发区并减轻或预防滑坡诱发损害已成为广泛关注的问题。
滑坡敏感性预测(LSP)是识别潜在滑坡、土地利用规划、滑坡灾害与风险评估的重要基础与核心内容之一。通常,LSP模型可分为四类:物理模型、启发式模型、数学统计模型与机器学习模型。自20世纪90年代以来,研究日益聚焦于非线性科学、系统科学与智能技术领域。其中,机器学习模型具有鲁棒性强、分类与回归应用精度高、能够处理缺失数据等优势,因此被学者广泛应用于全球LSP研究并取得了显著的预测效果。相关文献综述表明,决策树模型特别是随机森林(RF)模型相较于其他类型模型能够提供更准确可靠的预测,故本研究采用RF模型作为LSP建模的代表性机器学习模型。
制图单元的选择对机器学习LSP建模具有显著影响。当前,LSP的制图单元包括格网单元、地理单元、均匀条件单元、斜坡单元与地貌单元,其中格网单元与斜坡单元应用最为广泛。格网单元具有形状规则、划分便捷快速、计算效率高等优势,但在表达真实地形形态及与基本环境因子联系方面存在局限,导致预测结果缺乏明确的物理意义。斜坡单元按照真实地形形态划分,具有明确的地质特征含义,能够较准确反映不同地形特征的滑动区域。然而,在机器学习LSP模型的相关研究中,过多强调提升模型预测精度,仍缺乏关于如何选择制图单元及其影响规则的深入研究。例如,Ma等人比较了斜坡单元与格网单元下的LSP结果,但其研究仅比较了预测精度,缺乏对数据处理机制的更深入讨论。Zou等人通过比较不同数据驱动模型与制图单元条件下的LSP评价结果,指出AUC精度并不一定代表最优预测结果,并强调制图单元的选择对最终LSP结果的影响比数据驱动模型的选择更为深远。因此,为解释机器学习建模机制,探索不同制图单元引起的差异可为选取适宜LSP制图单元提供更具说服力的证据。
然而,当前常用的机器学习方法存在"黑箱操作"问题,直接导致预测结果缺乏信任与接受度,以及决策的不可解释与不可追溯问题。可解释方法是解决该问题的关键,其目标是理解机器学习在LSP中的训练与测试过程,探索不同环境因子对LSP结果的影响,并评价结果的可靠性。可解释机器学习在诸多领域受到广泛关注,如Xu等人验证了使用分层相关传播构建可解释机器学习模型在临床生物力学着陆模式识别中的可行性;Chen等人研究了类别不平衡对信用评分领域基于SHAP解释稳定性的影响;Jiang等人甚至讨论了可解释机器学习在典型地球科学研究中的实际应用场景,并指出可解释机器学习能够有效恰当地帮助地球科学家推进对过程的理解,但在相应的技术讨论中往往未能得到充分探索。由此可见,研究不同制图单元对LSP的影响对于可解释机器学习具有重要理论价值。
近年来,学者采用皮尔逊相关系数、基尼系数、卡方检验等方法解释模型输出(敏感性指数)与输入(环境因子)之间的相互作用。更多关注聚焦于机器学习模型的可解释方法研究,通过此类方法可对模型的决策机制与过程进行解释分析。可解释方法可分为前验/后验可解释方法,常用的后验可解释方法包括Shapley值、部分依赖图(PDP)、个体条件期望(ICE)、累积局部效应图(ALE)等。许多学者已将可解释方法应用于各行业的智能预测解释中。同时,众多研究者也将可解释方法应用于机器学习LSP中。例如,Dahal和Lombardo利用Shapley值解释Gorkha地震的模拟响应,证明可解释性能够有效解释单个制图单元的发生概率;Pradhan等人使用SHAP解释CNN滑坡敏感性模型,揭示了高程与坡度对滑坡概率的非线性影响。
当前大多数研究仅采用单一可解释指标来评价机器学习LSP模型,此外,即使进行多模型比较,关注点往往仍在于模型性能而非对其决策机制的系统解释。例如,Liu等人采用SHAP分析评估并解释了三峡库区宜昌段三种树型集成学习模型;Zhang等人利用SHAP分析方法进一步阐释XGBoost LSP评估模型,可定量分析环境因子贡献的差异。这些关于可解释方面的研究 frequently 局限于SHAP分析,缺乏从多角度多维度的系统阐述,尚未建立一套完整的可解释预测框架。以往单一可解释性方法的主要不足在于:(1)鲜有研究考察单因子值及环境因子间相互作用对预测结果的影响;(2)仅使用一种可解释方法得出的结果无法得到验证。目前仅有少数学者,如Sun等人基于SHAP与PDP相结合的综合解释框架,能够从整体和局部视角对整个LSP模型进行评价与解释。本研究针对LSP分析提出了新的评价指标,包括MSE特征重要性分析、基于PDP与ICE方法的单特征效应分析、基于ALE方法的双特征交互分析,以及基于实际案例的个体样本SHAP值分析,以进行可解释分析。在此基础上,结合传统精度评价方法,构建"综合可解释方法",以综合判定不同制图单元与环境因子对LSP的影响机制。
本研究选取浙江省平阳县作为研究区,采用斜坡单元与格网单元作为制图单元。斜坡单元基于地形曲率与水文特征划分的自然坡段定义,捕捉地形的连续变化。格网单元采用地理信息系统(GIS)生成,为空间参数量化提供结构化框架。利用RF模型构建LSP系统,该模型适用于处理高维数据并避免过拟合。随后,应用综合可解释性框架揭示斜坡单元与格网单元在LSP中的机制差异,探索两类制图单元的异同,为各自优势与局限性提供洞察。
研究采用的主要关键技术方法包括:以浙江省平阳县225处历史滑坡面(2000-2018年)为正样本,按7:3比例划分训练集与测试集;构建基于格网单元(8m分辨率,3311个滑坡格网)与斜坡单元(多尺度分割方法,225个滑坡斜坡单元)的RF模型;精度评价采用ROC曲线、预测率精度曲线及敏感性指数分布特征;综合可解释性框架涵盖MSE特征重要性分析、PDP与ICE单特征分析、ALE双因子交互分析,以及个体样本全特征SHAP值分析。
研究结果部分:
基于格网单元与斜坡单元的LSP:经Visual Studio Code软件基于Python 3.9.7内核编程,调用sklearn模型中RF分类器函数构建模型。格网单元参数设置为n_estimators=500、max_depth=15、min_samples_split=30、min_samples_leaf=20;斜坡单元参数设置为500、15、2、1。预测结果显示,两种制图单元的敏感性空间分布具有一定相似性,平原区均预测为低易发性区,北部、西部与南部山区历史滑坡集中区预测为高易发性区,平原与山区交界处亦显示高易发性。但细节存在差异:格网单元中山区与平原交界处多被划定为极高易发性区,而斜坡单元能更精确区分该界面处的敏感性分布;格网单元中部分历史滑坡稀疏分布的山区敏感性等级低于斜坡单元预测结果。
敏感性指数分布比较:格网单元敏感性指数均值为0.234、标准差为0.216,均小于斜坡单元的0.331和0.245。依据前人研究成果,敏感性指数均值较小且标准差较大时,LSP模型预测效果更优,分布更符合实际。
LSP精度比较:两种制图单元下RF模型精度均大于0.9,表明具有良好的准确性与预测能力。格网单元ROC-AUC为0.964、PAR-AUC为0.947,略优于斜坡单元的0.955和0.936。
综合分析表明,两种制图单元下RF模型的精度评价结果均较高,敏感性指数分布特征一致。尽管敏感性指数空间分布具有一定一致性与差异性,但仅通过敏感性图视觉判读与模型精度评价仍难以解释这些差异并确定何种预测结果更为可靠,因此有必要对LSP结果进行可解释性研究。
不同制图单元下综合可解释方法分析:
MSE特征重要性分析:RF模型具备MSE特征重要性分析功能,通过预测模型的最小平方误差衡量特征重要性。不同制图单元的因子重要性排序存在差异,但坡度与归一化建筑指数(Normalized Difference Built-up Index, NDBI)均为最具影响力的两个因子。当制图单元为斜坡单元时,地形湿度指数(TWI)与NDVI对LSP结果的影响远大于格网单元。然而,MSE特征重要性分析仅能告知TWI与NDVI影响较大,无法揭示其具体如何影响LSP结果。
基于PDP与ICE方法的单特征影响分析:为准确反映单特征值对预测结果的影响,本研究进一步将PDP与ICE方法融入综合可解释方法。PDP采用可视化方法解释单特征对LSP的影响程度,ICE则展示多样本特征与LSP结果的关系。以坡度为例,当坡度值在7.5°–10°范围内时,偏依赖值显著增加;当坡度大于10°时,偏依赖值增速放缓,约25°时开始下降,这可用岩土力学原理解释——25°–35°坡度接近或超过许多颗粒土与风化岩屑的休止角,松散物质难以累积维持稳定,缺乏浅层滑坡所需的足够未固结物质厚度,导致模型预测敏感性降低。比较格网单元与斜坡单元的坡度曲线发现,格网单元中部分依赖值呈分段线性变化,且坡度大于25°时斜坡单元对应依赖值下降更多。NDBI特征亦呈现类似分析模式,当制图单元为斜坡单元时,NDBI大于0.8后依赖值下降,与格网单元不同。
基于ALE方法的双特征交互分析:采用2D-ALE方法分析RF在不同制图单元下的敏感性结果。选取影响最大的坡度与NDBI组合,以及地质调查中最常用且物理意义最显著的坡度与高程组合进行分析。结果表明,当NDBI小于0.4且坡度小于10°,或NDBI为0.4–0.65且坡度大于30°时,格网单元的ALE值较大,表明显著促进滑坡;当NDBI小于0.4且坡度大于27°时,ALE值小于0,抑制滑坡。斜坡单元结果略有不同:NDBI小于0.5且坡度小于10°时样本抑制滑坡;NDBI小于0.4且坡度大于25°时,斜坡单元抑制滑坡的程度不如格网单元明显。坡度与高程的双因子交互结果显示,最促进滑坡的区域均为坡度小于10°且高程大于600m的区域,但斜坡单元在海拔小于100m、坡度15°–20°时存在比格网单元更大的ALE值区域,波动更为显著。这表明斜坡单元尺度上环境因子的变化对敏感性结果影响更显著,也验证了斜坡单元尺度更易受环境因子数据影响,需要更精确的数据以获得更准确的斜坡单元LSP结果。
特定案例个体样本全特征SHAP值分析:选取平阳县岳溪村一处滑坡库存实例作为样本。当制图单元为格网单元时,从滑坡内任意格网单元选取单样本;当制图单元为斜坡单元时,从对应滑坡的斜坡单元选取单样本。ArcGIS Pro软件中可将RF模型预测的LSP图投影至遥感影像构建局部LSP三维图,显示滑坡样本区被精确预测为极高易发性区,高与极高易发性区主要集中在坡脚及道路周边。依据现场勘探数据与历史地质灾害调查,该滑坡发生于2015年8月8日夜,损坏2间民房,直接经济损失约5万元,为小型土质滑坡,自然坡角约20°–25°,坡上方存在缓坡平台,冲沟发育,植被茂密。现场地质勘探分析表明主因包括:坡后房屋上方较陡且负地形发育;地质地层强风化,松散岩土层厚度大、结构松散;台风Sudirman导致短时骤降雨,持续强降雨使负地形汇水,松散土体易于雨水下渗加剧滑坡。
单样本全特征SHAP值分析结果显示,除年平均降雨特征为负SHAP值抑制敏感性结果外,其余因子均促进LSP结果。最显著促进敏感性结果的三个特征为坡度、NDBI和人口密度,与之前特征解释结果一致。不同制图单元下单样本全特征SHAP值结果存在差异:斜坡单元虽在同一区域选取,但各因子SHAP值更大,最终样本敏感性指数结果更高,表明斜坡单元的数据敏感性高于格网单元,与双因子解释结果相互验证。
综合可解释方法的LSP建模模式:
可解释性整合:可靠且全面的解释——以往LSP研究 predominantly 关注各特征影响排序,对单特征或样本如何影响LSP的解释有限,导致机器学习模型较物理模型可靠性不足。本研究提出的综合可解释性框架整合多种技术:首先使用MSE特征重要性识别关键环境因子并过滤次要因子;随后应用PDP与ICE曲线分析特征在其值域范围内的预测响应;对可能存在交互效应的变量引入2D-ALE方法量化联合效应的增强或抑制;最后采用SHAP值分析为个体样本的所有特征贡献提供定量解释。这些方法从群体层面到个体层面共同构成完整可解释路径。值得注意的是,框架内多种方法功能互补,从不同角度共同描绘模型决策逻辑,案例中各方法结论高度一致,表明模型决策机制内在自洽且稳健。
制图单元选择对可能性结果的影响分析——以往研究 frequently 忽视制图单元选择依据,仅基于单一制图单元开展LSP研究。本研究中通过精度评价难以确定何种制图单元更准确合理,但预测结果存在一定差异。借助提出的综合可解释框架对不同制图单元LSP结果进行详细分析,可在一定程度上解释差异并为制图单元选择提供参考。当研究目标为深入理解导致滑坡的机制,需LSP结果与真实地形、地貌及地质过程高度一致,且拥有高质量高精度环境因子数据时,斜坡单元为更优选择,因其更真实反映地貌过程,更好体现环境因子贡献,预测结果与现场调查在个体样本尺度上更一致。当主要目标为区域性LSP,且为制图单元制作方便、可用环境因子分辨率较粗时,格网单元是合适且稳健的选择,因其ALE响应更稳定,仍可获得较高精度。
特征重要性分析显示两种情况最显著环境因子仅在坡度与NDBI上有所不同,最不显著因子仅在土壤类型与土壤组成上存在差异。通过单特征效应分析比较,斜坡单元中坡度或NDBI在最大值处对滑坡表现出更显著的抑制作用,更符合实际情况。ALE双特征交互分析中,格网单元坡度大于35°且NDBI小于0.3时滑坡抑制最显著,而斜坡单元坡度小于10°且NDBI值在0.3–0.4之间时滑坡抑制最显著。环境因子变化时,斜坡单元ALE值波动程度大于格网单元。个体样本SHAP值分析发现,格网单元敏感性指数低于斜坡单元,斜坡单元RF模型对该单元预测滑坡可能性更高,证明斜坡单元中的尺度效应较格网单元更显著。
危险环境因子下滑坡综合可解释方法的优化方向:本研究提出的综合可解释方法能够从整体到案例水平对机器学习模型进行解释分析,改进了以往LSP建模可解释方法架构,通过多种可解释方法与历史滑坡调查数据验证实现LSP机器学习的白盒化。同时,对单样本进行综合特征分析并结合现场调查结果,可反馈至机器学习模型构建与制图单元选择。例如,所选滑坡样本中,上方负地形存在是滑坡主因之一,但格网单元作为独立个体仅与自身特征值相关,无法反映相邻单元构成的负地形特征;而斜坡单元可能因分辨率减小导致坡度降低,使格网预测较低敏感性指数。当前斜坡单元数据提取采用均值或众数操作虽便捷,但难以通过均值和标准差表示空间异质性,这种聚合可能引入不确定性,因极端值或局部变异可能被低估,影响局部敏感性预测准确性。未来改进可涉及纳入高分辨率遥感数据衍生的更精细环境因子,或额外参数更好捕捉内部异质性;也可通过智能识别遥感影像构建更合理的斜坡单元特异性影响因子,更好反映斜坡独特地貌特征。
综上所述,综合可解释方法能够对影响敏感性结果较大的影响因素实施针对性预防,剔除影响较小因子以降低模型复杂度;同时可整合具体现场调查与相关文献,验证或填补研究区对滑坡具有强诱发作用的影响因子空白,增强模型预测结果与研究区地理特征的对应程度。
研究结论:
本研究采用16项环境因子与RF模型对浙江省平阳县进行LSP与精度评价,随后通过综合可解释方法系统解译RF模型对不同制图单元的LSP结果,分析各制图单元预测结果差异的成因。主要研究发现如下:
(1)基于格网单元与斜坡单元制图单元,本研究构建RF模型预测平阳县滑坡敏感性,取得了良好的预测精度(AUC > 0.85)。格网单元与斜坡单元的ROC-AUC值分别为0.964和0.947,预测率分别为0.955和0.936。格网单元与斜坡单元预测精度相当,但前者略优。两种制图单元AUC精度均较高,敏感性结果均可为当地防灾减灾提供参考。
(2)鉴于以往LSP缺乏解释性或可解释方法,本研究提出综合可解释方法,从"MSE特征重要性分析"、"基于PDP与ICE方法的单特征分析"、"基于ALE方法的双因子交互分析"及"单样本全特征SHAP值分析"四个视角,系统解释了斜坡单元-RF与格网单元-RF模型预测平阳县滑坡敏感性的结果。综合可解释方法中各种方法结果可相互支撑,显著增强模型可解释性;发现影响滑坡的最重要因子为坡度和NDBI,进一步证明模型可解释性稳定可靠。
(3)基于综合可解释方法,本研究发现斜坡单元中尺度效应更为显著,因而斜坡单元更有利于RF模型判断。这为评价与优化LSP效果提供了新思路与参考。