使用双向LSTM与注意力机制基于2017至2025年历史地震数据预测地震震级的深度学习模型

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Scientific African》：Deep Learning Model for Predicting Earthquake Magnitude Using Bidirectional LSTM with Attention Mechanism on Historical Seismic Data from 2017 to 2025

【字体：大中小】 时间：2026年06月14日 来源：Scientific African 3.3

编辑推荐：

　　本研究介绍了一种利用历史地震数据预测地震震级的深度学习模型，数据收集自地震活跃区域，包括地中海盆地、南欧、北非和西亚，时间跨度为2017年至2025年。研究人员开发了一个增强有注意力机制的（bidirectional LSTM）双向LSTM网络，用于处理包含震

本研究介绍了一种利用历史地震数据预测地震震级的深度学习模型，数据收集自地震活跃区域，包括地中海盆地、南欧、北非和西亚，时间跨度为2017年至2025年。研究人员开发了一个增强有注意力机制的（bidirectional LSTM）双向LSTM网络，用于处理包含震级、深度、纬度、经度和编码区域信息的多变量时间序列数据。该模型关注震级高于4.9的重大地震事件，这些事件对于这些区域的人口密集区尤为重要。在来自这些构造活跃区域的2000条地震记录数据集上训练后，模型达到了0.9837的确定系数（R²）和±0.3震级容差范围内90.82%的准确率。其对即将发生的地震事件的预测表明震级为7.01，提示可能发生具有影响的地震事件。这些发现突显了深度学习技术在地中海-欧洲-非洲-亚洲地震带地震预测中的前景，及其增强弱势群体早期预警系统的潜力。

**研究背景、问题与目的**
地震作为最具破坏性的自然灾害之一，威胁生命、基础设施和全球经济。其不可预测性源于构造板块运动的复杂非线性动力学，传统预测方法（如基于Gutenberg-Richter定律的统计模型或确定性物理模拟）在长期概率评估上有效，但无法提供可靠的短期预测。近年来，深度学习在时序列建模中展现了潜力，长短期记忆（LSTM）网络及注意力机制的引入提升了地震检测和预测性能。然而，现有研究多集中于长期概率预测或单一模态数据。本研究旨在通过设计双向LSTM（Bi-LSTM）结合自定义注意力层的深度学习架构，解决短期震级预测挑战，融合多特征（震级、深度、纬度、经度和区域编码）对2017–2025年地中海-欧洲-非洲-亚洲交界带的地震事件进行预测。论文发表在《Scientific African》。

**关键技术方法**
数据来源包括美国地质调查局（USGS）和欧洲-地中海地震中心（EMSC），采集2000次震级>4.9的地震事件（2017–2025年），覆盖地中海盆地、南欧、北非和西亚。预处理包括：时间戳排序、区域特征独热编码、所有数值特征使用Min-Max缩放至[0,1]范围。采用滑动窗口（窗口长度n=40步）将时间序列转化为监督学习任务，生成1960个输入-目标对，按时间顺序划分训练集（70%）、验证集（15%）和测试集（15%）。模型架构包含两层堆叠Bi-LSTM（第一层256单元、第二层128单元，均返回完整序列），每层后附加丢弃率为0.2的Dropout正则化；自定义注意力层计算隐藏状态的加权上下文向量；最后通过三个全连接层（100、50、1神经元，前两层后加Dropout）输出震级预测。训练使用Adam优化器，均方误差（MSE）损失函数，学习率调度（初始0.001，在第16、34、43个epoch减半），并采用多种子交叉验证（种子42、123、999）确保稳健性。

**研究结果**
1. **模型性能**：在测试集上，模型达到均方误差（MSE）0.0284±0.0012、均方根误差（RMSE）0.1685±0.0018、平均绝对误差（MAE）0.1017±0.0014、确定系数（R²）0.9837±0.0021、±0.3震级容差内准确率90.82%±0.45%、平均绝对百分比误差（MAPE）2.07%±0.08%。与基准模型（朴素持久性、ARIMA、单向LSTM、单向LSTM+注意力）相比，所提出的Bi-LSTM+注意力在MAE、RMSE、R²上均显著最优，证明双向时序处理和注意力机制的必要性。
2. **训练动态**：训练过程中训练损失和验证损失持续下降，验证损失最终达0.0033，表明无显著过拟合，学习率调度促进了后期精细优化。

**讨论总结与结论翻译**
讨论部分指出：模型的高性能（R²=0.9837）证实深度学习方法在震级预测中的有效性，优于传统统计模型（如Gutenberg-Richter定律或ETAS模型）。Bi-LSTM层能从前后两个方向捕获序列动态，注意力机制智能聚焦关键事件（如前震序列），提升可解释性。模型对下一个事件的预测震级7.01位于训练数据上限，提示模型识别出了近期序列中的强震前兆模式，但该点估计缺乏置信区间，且未预测时间与精确位置，需结合地壳形变、氡气排放等地质指标综合评估。局限性包括：模型仅适用于M>4.9事件，未验证其对更小震级或不同构造区域（如太平洋火环）的泛化能力。

结论翻译：本研究成功证明了结合双向LSTM与注意力机制的深度学习架构可作为地震震级预测的强大工具。通过利用历史地震数据多变量时间序列，模型达到了显著的预测准确度（R²=0.9837），超越了众多传统预测技术。关键创新在于模型自动学习复杂非线性依赖关系并聚焦序列中最关键的前兆事件，兼具高性能与一定可解释性。高震级事件的预测突显了模型在近实时识别重大地震风险中的潜力。这些结果代表重要一步而非最终方案，未来方向包括：多模态数据融合（如地面干涉合成孔径雷达GB-InSAR、电磁辐射监测）、多输出预测（同时预测震级、震中与深度）、概率预测与不确定性量化、探索Transformer与图神经网络（GNN）等先进架构。总之，该模型在增强地震准备与减灾策略方面具有巨大前景。

联系信箱：

粤ICP备09063491号

热点排行