基于多模型耦合的广西高速公路滑坡敏感性评估与模型性能比较研究

【字体: 时间:2025年10月13日 来源:Geomatics, Natural Hazards and Risk 4.5

编辑推荐:

  本研究通过综合运用频率比(FR)、信息量(IV)、确定性系数(CF)三种单一模型,以及FR与逻辑回归(LR)、反向传播神经网络(BPNN)、支持向量机(SVM)、随机森林(RF)四种耦合模型,系统评估了广西壮族自治区高速公路沿线滑坡敏感性。研究选取了14个评价因子,并通过ROC曲线(AUC>0.80)验证了模型可靠性,其中FR-LR耦合模型精度最高(AUC=0.91),为类似地理条件下的公路地质灾害风险防控提供了科学工具和参考框架。

  
引言
滑坡作为一种自然现象,指斜坡上的土体或岩体部分或整体在重力作用下沿滑动面下滑,通常由地表水冲刷浸泡、地震、强降水及人类活动等因素诱发。中国地质灾害分布广泛,据自然资源部2020年数据,全国共记录地质灾害7840起,其中滑坡4810起,占比61.4%。高速公路沿线滑坡因其发生频率高、后果严重而备受关注,常导致财产损失、人员伤亡和交通中断,对公共安全与经济发展构成严重威胁。因此,准确评估滑坡敏感性对风险减缓与灾害预防至关重要。
滑坡敏感性分析(LSA)是风险管理的核心工具,旨在评估特定区域发生滑坡的概率。传统LSA方法可分为基于专家判断的定性方法、定量统计方法及机器学习技术。随着计算技术进步,机器学习(ML)与深度学习算法在滑坡敏感性建模中的应用日益广泛。然而,现有研究多集中于中国东部或中部地区,对广西等地质气候条件复杂区域的高速公路滑坡敏感性缺乏深入分析,且鲜有研究系统比较多种模型在高速公路特定场景下的性能。本研究旨在填补这一空白,通过模型比较与公路针对性分析,为广西地区高速公路相关地质灾害研究建立更精确、区域特异性的滑坡敏感性评估框架。
材料与方法
研究区概况
广西壮族自治区位于中国南部沿海,地处东经104°26′~112°04′,北纬20°54′~26°24′之间,辖14个地级市,总面积23.76万平方公里。研究区属亚热带季风气候区,温暖湿润,水热同期,年均气温17~23°C,年降水量1200~2000毫米,降水多集中于4~9月,夏季常受暴雨和台风影响。截至2024年底,广西公路总里程预计达17.24万公里,路网密集。复杂的地质、地形与气候条件为模型提供了丰富的数据集,增强了模型的代表性和普适性。2019年,广西境内共记录高速公路滑坡点4429处,其空间分布如图1所示。
数据来源
本研究采用地理空间数据云平台获取的30米分辨率数字高程数据(空间参考WGS1984_UTM),利用ArcGIS计算坡度、坡向、平面曲率、剖面曲率及地形湿度指数(TWI)等地形因子。所有数据均预处理并重采样至90米网格分辨率。其他数据类型详见表1。
研究方法
研究首先收集整理关键数据,利用GIS工具进行预处理,并应用方差膨胀因子(VIF)和容差指标科学评估因子间协方差。随后生成因子图,基于因子叠加构建单一模型。为提升预测性能,构建了耦合建模框架:以频率比(FR)模型输出作为逻辑回归(LR)、反向传播神经网络(BPNN)、支持向量机(SVM)和随机森林(RF)四种机器学习算法的输入特征,形成堆叠式耦合结构,通过将初始阶段预测输出输入后续模型以改进滑坡敏感性估计。最终利用ROC曲线评估比较七种模型结果,生成相应的滑坡灾害敏感性图,具体流程如图2所示。
因子选择
基于近期滑坡研究文献与Chen等人提出的因子选择方法,综合考虑研究区地形、气候等自然特征,最终确定14个影响因子进行滑坡敏感性分析。因子按自然断点法分为3~9个等级。通过VIF和容差指标评估因子协方差,所有14个评价因子均满足共线性诊断标准(容差>0.1,VIF<10),适用于滑坡敏感性分析,详见表2。
为更好反映公路基础设施对边坡稳定性的特定影响,本研究纳入了若干人为与基础设施相关因子,包括距道路距离、土地利用类型和人口密度。距道路距离反映了道路建设活动对地形的扰动程度;土地利用类型指示了道路相关开发导致的地表改造与植被损失;人口密度则作为基础设施强度的代理变量。这些公路特异性因子使模型区别于一般区域敏感性研究,明确了交通基础设施对滑坡发生的空间效应。
各因子具体分析如下:
  • 高程:研究区高程范围-100~2090米,滑坡点数量随高程增加而减少,-100~180米区间滑坡点最多(1536个,占36.49%),如图3a及附录表3所示。
  • 坡度:范围0°~49°,滑坡数量随坡度增加而减少,0°~3°区间滑坡点最多(1425个,占33.99%),如图3b。
  • 坡向:分为九类,滑坡分布相对均匀,最多为731个(占17.01%),如图3c。
  • 平面曲率:范围-1.23~1.55,滑坡点数量先增后减,-0.07~0.06区间最多(2886个,占68.57%),如图3d。
  • 剖面曲率:范围-1.56~1.31,变化反映地表坡度与地质特征变化,影响滑坡形成发展,-0.07~0.05区间滑坡点最多(2683个,占63.74%),如图3e。
  • 降水量:范围920.90~2345.40毫米,滑坡数量随降水先减后增,1529.80~1669.46毫米区间最多(1117个,占26.57%),如图3f。
  • 植被覆盖度(FVC):定义为植被所占区域总面积的比例,范围0~1,计算公式为FVC = (NDVI - NDVImin)/(NDVImax - NDVImin)。滑坡数量随FVC增加而增加,0.97~1区间最多(2549个,占62.48%),如图3g。
  • 地形位置指数(TPI):研究区地貌包括山脊、上坡、中坡、平地、下坡和山谷,多数滑坡发生于中坡(1623个,占38.64%),如图3h。
  • 地形湿度指数(TWI):表征湿润条件的地形指标,计算公式为TWI = ln(AS/tanβ),其中β为局部坡度,AS为特定集水区面积。研究区TWI范围5.55~27.55,滑坡数量随TWI增加而减少,8.23~9.95区间最多(1261个,占30.08%),如图3i。
  • 人口密度:范围0~35090人/平方公里,滑坡数量随人口密度增加呈减少趋势,0~306人/平方公里区间最多(3442个,占81.68%),如图3j。
  • 土壤湿度:范围0.11~0.49,滑坡数量随湿度增加而增加,0.35~0.38区间最多(1153个,占27.52%),如图3k。
  • 距道路距离:根据《公路安全保护条例》设定10米、20米和50米缓冲区。距道路越远,滑坡点数量越多,>50米区间最多(3821个,占90.82%),如图3l。
  • 岩石类型:基于岩石物理力学性质分为软岩、中等硬度岩石、硬岩和极硬岩。多数滑坡点分布于中等硬度岩石区(2142个,占51.09%),如图3m。
  • 土地利用类型:分为农田、森林、灌木、草地、水域、裸地和不透水面六类。多数滑坡发生于林区(2868个,占68.01%),如图3n和图4所示。
变分统计
频率比(FR)模型基于相似地质背景区域具有相似滑坡概率的假设,通过分析滑坡点分布与各影响因子分类间关系评估敏感性。计算公式为FRab = (Nab/N)/(Sab/S),其中FRab >1表示因子a的第b区间有利于灾害发生,反之则不利。
信息量(IV)模型通过信息量定量表达各因子对滑坡事件的影响程度,计算公式为I(Y, Xi) = ln[(Ni/N)/(Si/S)]。
确定性系数(CF)模型通过分析历史滑坡数据与相应影响因子间的数学统计关系确定各因子敏感性,计算公式根据条件概率PPa(=Nab/Sab)与先验概率PPs(=N/S)的比较分为两种情况。CF值越接近1,发生滑坡的确定性越高。
为避免概率估计尺度差异对模型精度的影响,对原始概率输出进行Min-Max归一化,线性映射至[0,1]区间,公式为Pnormalized = (P - Pmin)/(Pmax - Pmin)。
机器学习方法
逻辑回归(LR)模型用于解决二分类问题,通过Sigmoid函数将线性回归结果映射为滑坡发生概率,公式为P = 1 / [1 + e-(β01X1+...+βnXn)]。
反向传播神经网络(BPNN)由输入层、隐藏层和输出层组成,通过层间权重反映连接状态,其核心步骤包括前向传播、误差计算和反向权重更新,如图5所示。
支持向量机(SVM)通过寻找最优超平面实现分类,对线性不可分数据引入核函数映射至高维空间。本研究选用线性核函数,最优分类函数为f(x) = sgn[∑aiyiK(xi,yi)+b],其原理如图6所示。
随机森林(RF)模型以决策树为基学习器,通过Bagging集成与随机子空间采样降低过拟合风险,增强对噪声的抵抗能力,并能处理高维数据而无须特征缩放。
结果
模型评价结果
本研究利用三种单一模型(FR、IV、CF)和四种耦合模型(FR-LR、FR-BPNN、FR-SVM、FR-RF)对高速公路滑坡敏感性进行评估,结果按自然断点法分为极低、低、中、高和极高敏感性五个等级,详见表3。
单一模型
通过公式计算得到FR、IV、CF值后,在ArcGIS中进行因子叠加,生成三种单一模型的敏感性评价图,如图7所示。
耦合模型
为提升预测精度,本研究选择四种机器学习模型与FR进行耦合分析。研究区包含4019个高速公路滑坡点,随机生成同等数量的非滑坡点,共计8038个样本点作为实验数据。采用Hosmer-Lemeshow拟合优度检验评估逻辑回归模型的校准度,检验结果及混淆矩阵分别见表4和表5。敏感性分析结果如图8所示。
混淆矩阵显示模型在测试集中真阳性(TP)为2924,真阴性(TN)为3738,精确率达91.2%,但召回率相对较低(72.7%),表明模型对正样本的识别能力有待提升。此外,为优化BPNN模型性能,进行了系统超参数调优,具体参数见表6。
精度分析
本研究从高速公路滑坡点分布和ROC曲线两方面对七种模型的评估结果进行分析。
高速公路滑坡点分布反映了滑坡敏感性评价的最基本层面,可用于检验各模型的敏感性等级分布及可靠性。七种模型不同滑坡敏感性等级的百分比及滑坡点密度如图9和图10所示。
图9显示,FR-BPNN模型在低敏感性区域面积占比最大(49.84%),而CF模型在高敏感性区域占比最大(21.88%)。FR-BPNN模型在高敏感性区域占比最小,仅2.11%,表明CF模型捕捉高风险区空间特征的能力更强。FR系列耦合模型在不同敏感性等级表现差异显著:FR-RF模型在极高敏感性区域仅占0.52%,而FR-SVM模型占8.68%,这可能源于不同算法组合对风险梯度特征的响应机制不同。
图10表明,在极低和低敏感性区域,FR-BPNN模型的滑坡点密度显著高于其他模型,显示其在低风险背景中有效探测潜在滑坡信号的能力。在极高敏感性区域,FR-RF模型滑坡点密度最高,表明通过Bagging集成与随机子空间采样,FR-RF能有效捕捉高风险异常值分布,对复杂地质边界条件适应性强。
ROC曲线为验证七种模型评估结果的准确性,绘制了ROC曲线,如图11所示。模型精度排序为:FR-LR > FR-SVM > FR-RF = FR > FR-BPNN > IV > CF。FR-LR模型综合性能最佳,AUC值最高(0.91),这可能归因于逻辑回归对线性可分特征的可解释性强,与FR因子的特征选择有效性产生协同增强。这些发现凸显了耦合模型策略的有效性。此外,Wilcoxon符号秩检验表明FR-LR模型显著优于基础FR模型,AUC的提升可能源于逻辑回归应用于FR特征时的非线性补偿能力,检验结果见表7。
模型分析
本研究共采用七种模型评估高速公路滑坡敏感性,各模型在滑坡敏感性分析中各有优势。FR模型通过统计识别滑坡发生的有利条件,简单易实现;IV模型量化各因子贡献度,适于多因子综合分析;CF模型基于因果推理评估因子与滑坡发生的确定性关系。LR、BPNN、SVM、RF等方法则擅长处理复杂数据与不确定性,与FR集成可进一步提升模型预测精度与可靠性。
区别于一般区域滑坡敏感性研究多关注大尺度地形特征或自然景观,本研究专门针对高速公路廊道,此处滑坡对基础设施安全与人类生命构成直接威胁。公路特异性滑坡敏感性评估必须考虑路堑边坡、排水条件、交通振动、道路施工边坡改造等独特影响因子。这些人為与工程相关因子显著不同于区域尺度模型通常分析的自然边坡条件。
通过将此类公路特异性条件因子纳入模型,能更好反映公路边坡的真实岩土环境。耦合模型在捕捉公路场景中自然与人为诱发变量间复杂相互作用方面尤为有效。例如,FR与LR耦合时,FR组分可快速识别关键触发条件,而LR处理非线性相互依赖关系,提高预测精度;FR与RF耦合时,RF的集成学习特性最小化过拟合,提升鲁棒性与稳定性。
总体而言,耦合模型在高速公路滑坡敏感性分析中表现出更优的精度与可靠性,为交通廊道滑坡风险管理提供了更科学、针对性的基础。通过精度评估获得的模型性能排序进一步强调了所选方法的实际相关性。在公路工程项目中,根据特定地质与基础设施环境选择合适模型对提高效率、降低成本与增强安全性至关重要。
讨论
本研究通过ROC曲线系统评估了七种模型的高速公路滑坡敏感性并验证其预测精度。FR-LR耦合模型预测精度最高,AUC达0.908,与近期滑坡敏感性研究进展一致。例如,Huadan Fan等人在广西来宾市使用FR-LR模型实现了高精度高速公路滑坡预测;Lu Xiao等人证实了耦合模型在川藏交通廊道岩崩与滑坡灾害评估中的有效性。值得注意的是,Bammou等人报道在摩洛哥半干旱区,XGBoost、RF、KNN等独立模型AUC超0.9,而单一LR模型仅0.7。但本研究通过FR与LR耦合,显著提升了传统LR模型性能,AUC提高约21%,证实了在复杂环境中集成统计方法与机器学习的自适应优势。
尽管现有研究已探索多种滑坡敏感性模型,但针对"高速公路滑坡"的系统分析仍显不足。高速公路滑坡的形成机制具有鲜明特征:不仅受自然因素(如广西亚热带季风区典型的喀斯特地貌与强降水)影响,且与道路建设运营引发的人为扰动密切相关。本文选取的"距道路距离"因子揭示了公路工程对边坡稳定性的直接干预,而"土地利用类型"、"人口密度"等指标间接反映了沿线人类活动强度对滑坡风险的叠加效应。
然本研究仍存在若干局限。深度学习技术已在灾害敏感性评估领域广泛应用并展示巨大潜力,但本研究未充分探索深度学习方法,未能充分利用深度学习模型的强大能力以进一步提升灾害敏感性预测的准确性与可靠性。
此外,本研究未包含地震活动数据,主因广西壮族自治区非高烈度地震区,历史记录显示地震对滑坡影响相对有限。但近期研究表明,在构造活动区,断层作用、地壳抬升等地质过程可通过改变地形梯度、扰动地下结构显著影响边坡稳定性。因此,未来研究应考虑将构造背景作为潜在影响因子纳入滑坡敏感性评估,即使历史地震活动性低的区域,以提升评估的科学性与全面性。再者,本研究未探讨未来气候变化对滑坡风险的潜在影响,未来可结合气候变化模型分析降水格局变化如何影响滑坡敏感性。
此外,尽管这些模型在评估中表现强劲,但各有局限。如CF模型依赖专家经验赋权,缺乏灵活性且需大量数据;BPNN与SVM模型训练复杂、耗时,易过拟合,且BPNN可解释性差;RF模型虽一定程度降低过拟合风险,但计算复杂度高、可解释性有限。这些局限表明单一模型难以全面准确评估滑坡敏感性。因此,未来研究可考虑结合多种模型优势,通过耦合或集成方法提高精度与可靠性。
未来研究中,我们将致力于深化对公路灾害敏感性评估与分析的认知,选择应用更适宜模型对研究区进行精细评估。同时,关注模型适用性与普适性,旨在开发既针对特定区域又具广泛适用性的评估体系。为此,计划引入更先进的深度学习架构,如卷积神经网络(CNN)和极限梯度提升(XGBoost),以更好捕捉时空维度复杂特征。融合多源数据与深度学习技术有望为灾害敏感性评估提供更全面、精准的解决方案,从而为防灾减灾提供更强科学支撑。此外,未来研究将把地震活动、归一化植被指数(NDVI)、气候变化等因素纳入滑坡敏感性评估模型,以提升滑坡灾害预测的准确性与可靠性。通过这些努力,旨在为其他类似区域提供宝贵经验与参考,为高速公路滑坡灾害防控提供科学依据。
结论
本研究选取14个评价因子,运用七种模型评估了广西壮族自治区高速公路滑坡敏感性,获得了研究区敏感性分区图。研究发现:
(1) 广西壮族自治区共识别出4429个滑坡点,沿高速公路高度集中,尤以东部地区及柳州、桂林部分区域为甚。
(2) FR-SVM模型在极高敏感性区域占比8.68%,而FR-RF模型具有最高的高速公路滑坡点密度,表现出对复杂地质边界条件的强适应性。
(3) 七种模型均表现出高可靠性,ROC曲线验证精度均超0.80。其中FR-LR模型精度最高,达0.91,表明其在准确识别高速公路相关滑坡高敏感区方面能力突出。
本研究主要优势在于专门针对高速公路滑坡灾害,为山区及地质敏感区域公路安全管理提供了实用、针对性的见解。在此基础上,研究不仅支持公路基础设施更有效的维护运营,且为应急救援、交通保障及灾后重建提供了关键数据支撑,对提升公路交通安全、增强交通系统整体韧性具有重要意义。
未来研究中,我们将进一步优化本研究所用机器学习模型,对SVM和BPNN模型进行大量超参数调优以提高精度;探索更先进的机器学习与深度学习架构;实施集成方法融合多模型以减少预测偏差。此外,计划采用数据融合技术,结合实时监测数据与历史数据集,提升模型捕捉短期波动与长期演变趋势的能力。通过解决这些方面,未来研究可促进更有效的滑坡灾害评估与缓解策略制定,最终提升公路基础设施的安全性与韧性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号