基于LightGBM和多源观测数据的地震烈度预测模型研究——以门源地震为例
《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》:Investigation of a seismic intensity prediction model using multisource observation data based on the LightGBM method
【字体:
大
中
小
】
时间:2025年12月17日
来源:IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing 5.4
编辑推荐:
本文推荐研究人员针对传统地震烈度预测方法空间分辨率有限、准确性不足的问题,开展了基于LightGBM机器学习算法的地震烈度预测模型研究。通过集成InSAR同震形变场与高程、坡度、土地利用等静态环境因子,构建了门源地震区的烈度预测数据集。模型预测精度达0.87,验证均方根误差为0.43,显著提升了烈度评估的时空分辨率和可靠性,为地震应急响应提供了可靠技术支撑。
我国地处环太平洋地震带与欧亚地震带交汇处,地质构造复杂,活动断裂发育,是世界上地震灾害最严重的国家之一。当前地震预测技术尚不成熟,震后灾害评估与应急响应成为减轻人员伤亡和经济损失的关键环节。地震烈度作为衡量地震破坏程度的核心指标,其快速准确获取对应急救援决策具有重大意义。然而,传统烈度预测方法主要依赖地震台网记录或单一形变数据,存在空间分辨率低、时效性差等局限,难以满足震后紧急响应的需求。
针对这一挑战,长安大学与中国地震局地震研究所的联合研究团队在《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》发表最新研究成果,首次将合成孔径雷达干涉测量(InSAR)获取的同震形变场与静态环境因子相结合,建立了基于LightGBM(Light Gradient Boosting Machine)算法的地震烈度预测模型。研究以2016年门源Mw5.9地震和2022年门源Mw6.7地震为案例,开创性地将空间连续的形变场与地形、地质、环境等多源观测数据融合,突破了传统方法的时空限制。
研究团队采用多项关键技术方法:首先利用Sentinel-1A卫星C波段SAR数据,通过差分InSAR(D-InSAR)技术提取同震形变场;结合30米分辨率SRTM数字高程模型(DEM)衍生地形因子,基于NEHRP标准进行场地分类,整合GlobeLand30土地利用数据、1:50万地质图岩性数据和土壤液化敏感性数据;最后通过地理信息系统(GIS)技术将多源数据统一至WGS_1984_UTM_Zone_47N坐标系,建立100米网格分辨率的烈度预测数据集。
研究团队对同震形变场、静态影响因子和烈度参考数据进行了系统预处理。针对2016年和2022年两次门源地震,分别利用升降轨Sentinel-1A影像,通过两轨法D-InSAR技术获取视线向(LOS)同震形变场。结果显示2022年Mw6.7地震形变场呈明显NWW-SEE向展布,最大形变量达70毫米,与冷龙岭-托莱山断裂带走向一致。
静态因子处理包括:基于DEM提取高程、坡度、坡向数据;根据坡度与Vs30(30米平均剪切波速)关系进行场地分类;对GlobeLand30土地利用数据重分类为6类;将岩性划分为硬岩组、较硬岩组等5类工程地质岩组。所有数据统一采用双线性插值(连续变量)和最邻近插值(分类变量)方法重采样至100米网格。
将预处理后的栅格数据转换为点数据,建立包含125,653个样本的烈度预测数据集。对离散数据进行分类编码,如场地分类(I-IV类编码为1-4)、土壤液化(5级敏感性编码为1-5)、岩性(6类编码为1-6)等。对同震形变场中的缺失值采用均值法填补,确保变形信号的时空连续性。
采用LightGBM算法构建预测模型,通过网格优化方法确定最优参数组合:num_leaves=40, max_depth=15, n_estimators=40, learning_rate=1等。数据集按8:2比例划分为训练集和测试集,采用三折交叉验证优化参数,五折交叉验证评估泛化能力。
模型在测试集上准确率达0.87,宏平均F1分数0.88。混淆矩阵显示,VI度、VII度、VIII度烈度的召回率分别为0.87、0.88、0.94,表明模型对高烈度区预测性能更优。特征重要性分析揭示同震形变场影响最大(重要性值≈1200),其次为高程(962)、坡度(484)、岩性(317)等因素,坡向和土壤液化贡献较小。
将训练好的模型应用于2022年门源Mw6.7地震预测,结果显示IX、VIII度区呈蝶形分布,与形变场空间模式高度一致;VII、VI度区因静态因子影响增强呈现交错分布。经外包络椭圆拟合优化后,预测结果与中国地震局官方烈度图空间一致性高,均方根误差(RMSE)0.43,平均绝对误差(MAE)0.41。
误差分析表明预测偏差均值μ=-0.30,标准差σ=0.58,误差分布集中且无系统偏差。对比2016年逆冲型地震和2022年走滑型地震的烈度分布特征,发现震源机制对烈度空间模式具有主导影响:逆冲地震产生近圆形高烈度区,走滑地震形成沿断裂带的条带状分布。
研究证实了集成InSAR形变场与静态环境因子的LightGBM模型在地震烈度预测中的有效性,为区域地震应急响应提供了高时空分辨率的解决方案。未来可针对不同震源机制和植被覆盖区优化模型,并结合GPU加速计算提升大范围应用能力。该框架为发展智能化的地震灾害快速评估体系奠定了重要基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号