土耳其梅尔辛省西部的滑坡易发性频率比分析及基于机器学习的分类:采用SMOTE算法的综合方法

《Journal of African Earth Sciences》:Frequency Ratio and Machine Learning-Based Classification of Landslide Susceptibility in the West of Mersin province, Türkiye: An Integrated Approach Using SMOTE

【字体: 时间:2026年02月20日 来源:Journal of African Earth Sciences 2.2

编辑推荐:

  滑坡易感性评估在穆特和西里夫凯地区采用频率比法与八种机器学习算法对比,发现随机森林和决策树预测性能最优,生成了涵盖极低到极高易感性的区划地图,揭示地形地质特征对滑坡分布的主导作用。

  
作者:?a?r? ?A?AN、Talas Fikret KURNAZ、Caner ERDEN
土耳其梅尔辛省灾害与应急管理当局(AFAD)

摘要

本研究采用频率比方法结合机器学习算法,评估梅尔辛省的滑坡易发性,重点关注Mut和Silifke地区,并使用了包含关键影响因素的综合性数据集。除了频率比方法外,我们还评估了八种机器学习算法的预测性能:随机森林、决策树、XGBoost和逻辑回归。通过独立测试数据的对比分析,确认随机森林和决策树算法是最佳的预测工具。具体而言,随机森林模型在预测高滑坡易发区域时具有最高的召回率(0.92)。这一强大的模型有助于绘制详细的滑坡易发性地图,将区域划分为从极低到极高的易发性等级。研究结果表明,Mut和Silifke的高易发区域主要集中在特定的地形和地质特征周围,这突显了当地地质条件对滑坡发生的重要影响。本研究强调了基于集成方法的优越性能,尤其是随机森林在捕捉环境因素与滑坡易发性之间复杂关系方面的优势。我们的发现展示了机器学习在自然灾害分析和滑坡易发区域的空间规划中的应用潜力。

引言

地震和滑坡在全球范围内频繁发生,并根据其空间背景成为自然灾害。滑坡是最严重的自然灾害之一。滑坡属于质量运动现象,定义为岩石、土壤或碎石在斜坡上的向下移动(Cruden, 1991)。滑坡会造成巨大破坏,影响人类生活和经济活动(Glade, 1998),每年在全球范围内造成数十亿美元的损失以及人员伤亡(Gorsevski等人, 2000)。因此,识别滑坡易发区域对于减少潜在损害至关重要。在考虑受自然灾害影响的房屋数量的研究中,滑坡造成的损失仅次于地震(?an等人, 2013)。地震也可能引发滑坡。例如,在土耳其最近的地震中,发生了数千次滑坡(Gorum等人, 2023;Karakas等人, 2021;Kocaman等人, 2025)。在这种情况下,识别滑坡易发区域对于减少潜在损害和制定灾害评估策略至关重要。
减少滑坡相关损害的一个基本步骤是建立包含类型、活动和地理位置等特征的全面滑坡清单和数据库。该数据库是滑坡易发性和灾害评估的基础(Guzzetti等人, 1999)。滑坡易发性可以根据地质、地貌、气候、植被和土壤特征等条件,对某一地点发生滑坡的概率进行相对分类(Reichenbach等人, 2018)。在评估滑坡易发性时,需要确定过去/当前滑坡的特征以及导致滑坡的因素(地形、地质和环境因素),并调查未来可能具有相同特征的潜在滑坡区域。在滑坡易发性分析中,必须充分评估复杂的质量运动结构及其成因。通过这些分析获得的滑坡易发性地图的可靠性取决于高质量、准确且可用的数据,以及正确选择用于分析的方法和模型。过去导致滑坡的因素和条件将是今天或未来可能发生滑坡的前兆(?an等人, 2013;Guzzetti等人, 1999;Lee和Min, 2001;Tekin, 2019;Tekin和?an, 2018)。因此,滑坡易发性地图可以揭示并研究控制滑坡的因素及其分布之间的关系。地理信息系统(GIS)是识别和解释滑坡易发区域的最有效工具之一,能够在评估其社会影响方面提供更高的速度、精度和成本效益。GIS是一组用于收集、存储、查询、传输和显示地球数据的工具(Burrough, 1998)。GIS、遥感技术、计算机技术和软件的最新发展为存储和统计分析大量数据提供了可能。
已经开发出多种方法来制作滑坡易发性地图,这些方法大致分为定性和定量方法。定性方法依赖于专家知识和直接现场观察,而定量方法则使用计算机辅助的数据分析(Ayalew和Yamagishi, 2005;Carrara等人, 1995;Sarkar和Kanungo, 2004)。定性方法包括基于现场经验进行的直观方法或指数和参数图的叠加。定量方法包括统计分析、岩土工程方法和人工智能(AI)方法等多种途径。多年来,世界各地的研究人员应用了多种定量方法来制作滑坡易发性地图,如频率比(FR)(Akgün, 2012;Akgün等人, 2012;Ozdemir和Altural, 2013;Pradhan和Lee, 2010;Umar等人, 2014;Y?lmaz, 2009)、层次分析法(AHP)(Althuwaynee等人, 2014;Ercano?lu等人, 2008;Komac, 2006;Yal??n等人, 2011)和逻辑回归(Akgün和Erkan, 2016;Duman等人, 2006;Kundu等人, 2013;Nandi和Shakoor, 2009;Nefeslio?lu等人, 2008;Tunusluoglu等人, 2008;Wang等人, 2015;Yesilnacar和Topal, 2005)。滑坡涉及许多不确定性和复杂性,这些不确定性由复杂的地质、地貌特征和土地利用变化引起。为了克服滑坡易发性评估中的不确定性,研究人员最近转向了机器学习(ML)技术,因为这些技术能够有效解决复杂问题(Khaliq等人, 2023)。各种ML方法,如人工神经网络(ANN)(Aditian等人, 2018;Can等人, 2019;Choi等人, 2012;Conforti等人, 2014;Ercano?lu, 2005;Kawabata和Bandibas, 2009;Melchiorre等人, 2008;Romer和Ferentinou, 2016)、模糊逻辑方法(Akgün, 2012;Chen等人, 2017a;Ercano?lu和Temiz, 2011;Kanungo等人, 2009;Wang等人, 2013;Y?lmaz, 2010)、支持向量机(SVM)(Pradhan, 2013;San, 2014;Tien Bui等人, 2016;Yao等人, 2008)、随机森林(RF)(Chen等人, 2017b;Kaya Topa?li等人, 2024;Kim等人, 2018;Kutlug Sahin等人, 2020;Sevgen等人, 2019;Youssef等人, 2016)和混合模型(Balogun等人, 2021;Chen等人, 2021;Pham等人, 2019;Saha等人, 2023;Zhang等人, 2019)以及深度学习(DL)算法(Azarafza等人, 2021;Huang等人, 2020a;Li等人, 2021;Xiao等人, 2018)已被广泛应用于世界各地的滑坡易发区域。上述研究中的一个共同点是,ML模型比其他方法提供了更高的预测准确性(Huang等人, 2020b)。
由于土耳其的构造和地质结构,该国极易发生自然灾害。根据国家统计数据,地震在人员伤亡和财产损失方面位居首位,其次是滑坡和落石(AFAD, 2020)。东黑海地区由于地形陡峭和降雨量大,是滑坡最易发的区域(Akinci等人, 2020;Altürk, 2019;Ayd?no?lu和Altürk, 2022;Ba?alan, 2022;Bilgin, 2019;Ersay?n, 2022;Karakas等人, 2020;Mutlu, 2023;Nefeslio?lu和G?k?eo?lu, 2011;Orhan等人, 2020)。除了东黑海地区外,土耳其的东安纳托利亚、中安纳托利亚和地中海地区也发生了严重的滑坡灾害(AFAD, 2020)。本研究重点评估了梅尔辛省西部两个相邻地区的滑坡易发性,梅尔辛省是地中海地区最大的省份之一。在研究1950年至2019年间地中海地区发生大规模滑坡的数量时,梅尔辛省的滑坡数量最多,共374次(AFAD, 2020)。梅尔辛省有许多可能发生滑坡的区域,其中一些是居民区,一些是农业区,还有一些是农村地区。正如上述研究所述,ML技术在滑坡易发性分析中提供了较高的估算精度(Kavzoglu等人, 2018;Sachdeva等人, 2020)。然而,目前还没有针对Silifke和Mut地区或整个梅尔辛省进行过全面的滑坡易发性研究并发表相关成果。只有?il(2009)对研究区域东部的Erdemli地区进行了基于GIS的滑坡易发性分析,Tekin(2019)对研究区域西部的G?ksu流域进行过一些ML方法滑坡易发性评估。特别是在最近时期,2018年、2019年和2020年,影响并破坏了Silifke和Mut地区的许多滑坡事件,以及连接这两个地区的公路(图1)。在这些滑坡事件中,连接两个地区的公路长时间处于关闭状态。本研究使用频率比方法(一种统计方法)以及随机森林、逻辑回归、决策树、K-最近邻(KNN)、梯度提升(Gradient Boosting)、AdaBoost、Extra Trees、XGBoost等多种ML方法来揭示Silifke和Mut地区的滑坡易发性。所有模型的性能结果都进行了比较评估,并将每个模型的结果与滑坡易发性地图一起呈现,以确定研究区域的滑坡易发性。

研究区域

研究区域包括梅尔辛省西部的Silifke和Mut两个相邻地区(图2)。Silifke地区占该省总面积的18%,面积为2693平方公里,其中89%为山区,11%为平原。沿海地区具有典型的地中海气候:夏季炎热干燥,冬季温和多雨;而内陆地区夏季凉爽,冬季寒冷多雪。长达268公里的G?ksu河流流经该区域。

频率比

频率比(FR)模型是一种基于观察每个滑坡影响因素与过去滑坡分布之间空间关系的统计方法。该方法用于建立滑坡位置与滑坡解释因素之间的空间关系。通过计算每个子类的相关事件频率来计算频率比,进而利用这种方法得出滑坡易发性指数(LSI)。

结论

滑坡易发性研究是减少滑坡造成的损害和辅助土地利用规划的基础,由于认识到滑坡带来的重大损害,这类研究日益重要。GIS、遥感技术、计算机技术和软件的最新发展为存储和统计分析大量数据提供了可能。因此,人工智能和统计分析的应用在滑坡易发性评估中发挥了重要作用。

作者贡献声明

?a?r? ?A?AN:概念构思。Talas Fikret KURNAZ:验证、监督、数据整理、概念构思。Caner Erden:撰写——审稿与编辑、初稿撰写、可视化、验证、软件使用、数据整理、概念构思

未引用参考文献

Trigila等人,2015年。

利益冲突声明

作者声明他们没有已知的可能会影响本文工作的竞争性财务利益或个人关系。

数据可用性

数据可应要求提供。

资金声明

本研究未获得公共部门、商业部门或非营利组织的任何特定资助。

利益冲突声明

作者声明他们没有已知的可能会影响本文工作的竞争性财务利益或个人关系。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号