通过迁移学习实现滑坡易发性地图的跨区域外推

《Geoscience Frontiers》:Cross-regional extrapolation of landslide susceptibility mapping via transfer learning

【字体: 时间:2025年11月23日 来源:Geoscience Frontiers 8.9

编辑推荐:

  滑坡敏感性评估中迁移学习模型(TL)的跨区域泛化性能优于随机森林(RF)和CNN-BiLSTM模型,尤其在数据量不足时表现更优,并通过SHAP算法揭示了距离河流、SPI指数、坡度和地形高程是最关键的影响因素

  本研究聚焦于滑坡易发性图(Landslide Susceptibility Mapping, LSM)技术,旨在解决传统机器学习方法在跨区域应用时所面临的局限性。滑坡作为一种常见的地质灾害,尤其在地形复杂、地质条件多变的地区,其发生频率和影响范围往往较高。重庆市作为典型的山地城市,其滑坡灾害问题尤为突出,特别是在三峡水库区域(TGRA)内的多个县区,如万州区和巫山县。这些区域因地质构造活动频繁、水位波动显著以及人类活动密集,导致滑坡频发,因此,精准的滑坡易发性图对于灾害防控、风险评估和土地利用规划具有重要意义。

当前,滑坡易发性图的研究主要依赖于知识驱动、数据驱动和物理驱动三种方法。随着大数据和人工智能技术的发展,机器学习方法在该领域得到了广泛应用。然而,传统机器学习模型在跨区域应用时常常面临模型泛化能力不足的问题。例如,一个区域内训练出的高精度模型在另一个区域的预测效果往往不佳,这限制了其在更广泛范围内的应用价值。因此,如何提高模型在跨区域环境下的泛化能力,成为研究的重要方向。

为应对这一挑战,本研究提出了一种基于迁移学习(Transfer Learning, TL)的模型,该模型构建于卷积神经网络(CNN)与双向长短期记忆网络(BiLSTM)的框架之上,称为CNN-BiLSTM-TL模型。该模型的设计目标是通过预训练和微调策略,提升滑坡易发性图在跨区域环境下的预测性能。为了验证这一方法的有效性,研究者构建了11种不同的建模场景,其中万州区作为训练区域,巫山县作为目标区域进行跨区域预测。研究还引入了SHAP算法,用于对模型进行全局解释,揭示各个条件因子对滑坡易发性预测的影响。

在研究区域的选择上,万州区和巫山县虽然地理和气候条件相似,但在地形、地质和城市化进程方面存在差异。这种差异为模型跨区域泛化能力的验证提供了理想的对比环境。研究团队收集了11,397个滑坡实例,涵盖1960年至2020年间重庆的滑坡数据,并对这些数据进行了详细的分类,包括发生时间、位置、坡度几何特征、触发因素、海拔高度、滑坡体积和灾害等级等。此外,还结合了13个条件因子,包括地形、地质、环境和人类活动相关的数据,如海拔、地形起伏度、坡度、坡向、平面曲率、剖面曲率、地形湿润指数(TWI)和坡度势指数(SPI)、土壤厚度、距离断层、归一化植被指数(NDVI)、距离河流、距离道路等。

研究发现,当使用传统机器学习模型(如随机森林RF和CNN-BiLSTM)进行滑坡易发性图预测时,直接扩展训练数据集并不能有效提升跨区域预测的准确性,反而可能导致滑坡易发性图的高估。这表明,单纯增加训练数据的规模并不一定能改善模型在不同区域的泛化能力。相比之下,基于迁移学习的模型通过在源区域进行预训练,再在目标区域进行微调,能够更有效地提取和迁移滑坡发生的关键特征,从而提升模型在目标区域的预测性能。研究结果还表明,随着源区域数据量的增加,迁移学习模型的跨区域预测性能也随之提高,尤其是在源区域数据覆盖更广泛的区域时,模型的预测能力得到了显著增强。

此外,研究团队利用SHAP算法对模型的预测结果进行了全局解释,以更好地理解各条件因子对滑坡易发性的影响。分析结果显示,巫山县和万州区的滑坡易发性主要受以下四个条件因子影响:距离河流、坡度势指数(SPI)、坡度和海拔。其中,距离河流和坡度势指数表现出较强的正相关性,即距离河流越近、坡度势指数越高,滑坡发生的可能性越大。而海拔则呈现出整体负相关性,表明低海拔地区更易发生滑坡。这些结果为滑坡灾害的防控提供了科学依据,也为相关决策者提供了重要的参考信息。

在模型的构建过程中,研究团队采用了一种基于地理信息系统(GIS)的处理方式,将矢量数据转换为栅格数据,并以30米为单位进行建模。这确保了模型能够充分利用空间信息,提高预测的精度。同时,研究还通过不同建模场景下的对比分析,揭示了迁移学习模型在跨区域预测中的优势。例如,在不同的训练区域组合下,迁移学习模型的表现优于传统的机器学习模型,尤其是在源区域数据量较大的情况下,其预测结果更为稳定和可靠。

研究还发现,尽管迁移学习模型在跨区域预测中表现出色,但其性能仍受到训练数据质量的影响。因此,在模型构建过程中,如何选择合适的源区域和目标区域,以及如何优化训练数据的分布,是提升模型泛化能力的关键因素。此外,研究团队还通过定量分析和可视化方法,对模型的预测结果进行了深入探讨。例如,研究发现,迁移学习模型在高和极高滑坡易发性区域的预测准确率较高,而传统模型则在某些情况下表现出明显的高估现象。

本研究的成果不仅为滑坡易发性图的构建提供了新的思路,也为相关领域的研究提供了重要的参考。通过迁移学习方法,可以有效解决传统机器学习模型在跨区域应用中的局限性,提高模型在不同地理环境下的适应性和预测能力。同时,SHAP算法的应用使得模型的预测结果更具可解释性,有助于提升公众对模型的信任度,并为灾害防控提供更科学的决策支持。

综上所述,本研究通过构建基于迁移学习的滑坡易发性模型,验证了其在跨区域预测中的优越性,并揭示了影响滑坡易发性的关键条件因子。研究结果表明,迁移学习方法能够有效提升滑坡易发性图的泛化能力,特别是在数据量较大的情况下。此外,模型的可解释性分析也为滑坡灾害的防控提供了新的视角,有助于深入理解滑坡发生的机制,并为相关政策制定提供科学依据。未来,研究团队计划进一步优化模型的结构和参数,以提高其在更多区域的应用效果,并探索其他条件因子对滑坡易发性的影响,为滑坡灾害的预测和防控提供更加全面的技术支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号