可部署且精确的时间序列预测模型,用于监测挡土墙的变形情况
《CMES - Computer Modeling in Engineering and Sciences》:Deployable and Accurate Time Series Prediction Model for Earth-Retaining Wall Deformation Monitoring
【字体:
大
中
小
】
时间:2025年10月10日
来源:CMES - Computer Modeling in Engineering and Sciences
编辑推荐:
预测土压力墙变形的ARIMA与LSTM模型对比研究。通过分析三个实际开挖现场的 inclinometer 时间序列数据,发现LSTM模型在捕捉非线性时序特征方面优于ARIMA,尤其在长期预测中表现更优。结合注意力机制提出的ATLSTM模型,通过动态加权聚焦关键时间步,使预测误差降低26.6%,且在跨不同地质条件的新开挖现场的迁移学习中仍保持高精度(MAPE <5%)。研究证实LSTM类模型适用于工程实时监测,而注意力机制可进一步提升复杂工况下的预测鲁棒性。
在地下空间开发过程中,开挖作业常常导致土钉墙(ERW)发生变形,这种变形可能对周围结构和地面产生重大影响。因此,建立可靠的预测模型对于支持施工过程中的及时决策至关重要。本文研究通过使用传统的统计模型ARIMA(自回归积分滑动平均模型)和基于深度学习的LSTM(长短期记忆网络)来预测土钉墙的变形,利用开挖现场的倾角计数据,并比较了这两种模型的预测性能。研究还提出了一种基于注意力机制的LSTM模型(ATLSTM),以提升预测性能并解决开挖现场领域变化带来的问题。通过系统分析和实验比较,文章表明LSTM模型在预测性能上显著优于ARIMA模型,并展示了ATLSTM在处理短期和长期预测以及应对开挖环境变化方面的有效性。
### 1. 引言
开挖作业引起的土钉墙变形对周边环境和结构安全具有重要影响。准确预测这些变形对于减少对周围环境的影响至关重要。多年来,土钉墙变形已被广泛研究,而现场测量是理解变形最直接的方法。自1969年Peck的研究发表以来,基于实际测量数据的开挖现场数据已被大量记录。例如,已有经验方法通过土壤类型对土钉墙的运动模式进行分类和预测。尽管如此,研究仍集中在使用测量数据来分析不同开挖阶段的墙体位移和周围地面行为,并探讨地面沉降与相邻结构之间的关系。Lee等人提出了深基坑软土开挖过程中建筑物损坏的风险评估案例,而Son和Cording则研究了建筑物响应特性,包括损坏估计和建筑物刚度对开挖引起的变形的影响。Lam等人通过物理模型试验提供了多支撑开挖中地面变形机制的见解,Finno等人则通过城市环境中的现场观测记录了深基坑的性能。Cui等人结合现场监测和数值模拟,评估了超深基坑过度或不足开挖场景的影响。Zheng等人通过测量和数值分析研究了复杂框架土钉墙系统在多台阶开挖中的变形行为。
数值分析方法也被广泛用于评估开挖引起的变形问题。数值研究考虑了诸如土壤类型、开挖现场形状、墙体类型、支撑系统和施工技术等影响因素。此外,还分析了墙体长度、深度、支撑层深度和支撑材料刚度对地面行为的影响。虽然数值分析可以理论性地通过考虑地面与结构元素之间的相互作用来更准确地预测,但它常常面临无法全面考虑所有影响因素的挑战,且结果有时与现场测量不一致。
近年来,数据驱动的机器学习技术在岩土工程中得到了越来越多的应用。许多研究已应用机器学习技术来预测土钉墙的变形,展示了使用诸如人工神经网络(ANN)、随机森林(RF)、广义回归神经网络(GRNN)、支持向量机(SVM)、多元自适应回归样条(MARS)、极端梯度提升(XGB)和最小二乘支持向量回归器(LS-SVR)等ML方法的可行性。Kung等人和Goh等人使用ANN估计开挖期间墙体的偏移,显示了其与软粘土现场数据的良好一致性。Zhang等人对地下开挖中软计算技术进行了全面综述,总结了ML模型的能力和挑战。最近,集成学习方法被用于提高预测的鲁棒性,如在各向异性粘土中的隔板墙变形建模和施工场景下的土钉墙侧向位移预测。Sheini Dashtgoli等人比较了几种ML算法在预测士兵桩墙开挖中最大位移时的表现,突出了模型效率和泛化能力。基于基因表达编程(GEP)的模型也被提出用于预测土钉墙的最大侧向位移,显示了其高精度和通过敏感性分析揭示土壤密度作为最具影响力因素的能力。深度学习技术因其处理大量复杂数据的能力而受到关注。在各种深度学习方法中,循环神经网络(RNN)在处理类似地面变形的时间序列问题上具有独特优势。最近,Zhao等人使用卷积神经网络(CNN)预测土钉墙的变形,显示其在时间序列预测中优于传统LSTM。本研究关注于短期预测(约7天内)和土钉墙的空间变化,通过结合1D CNN和LSTM,展示了其能够反映土钉墙的空间和时间特性,尽管增加模型参数可能会延长训练时间。最近,基于CNN的VGG6已被应用于土钉墙变形预测,结果显示其在不同地面属性下能够提供可靠的预测,优于RF-FEM(随机场有限元法)。基于条件随机有限元法(CRFEM)的可靠性基础地震稳定性分析通过结合场地特定的地质统计数据,提高了侧向位移和安全裕度的预测精度。
尽管已有许多研究使用了包括地面条件、结构设计参数和数值模拟结果在内的多种输入变量,但专注于现场实时监测的应用却存在局限性。这使得基于开挖阶段或开挖持续时间的墙体变形预测变得困难。然而,也有研究专注于使用开挖现场的测量数据进行现场适用性分析。Shan等人报告了通过结合经验模态分解(EMD)方法和使用开挖现场数据(包括回填沉降、相邻建筑数据和墙体变形数据)的时空聚类来提升LSTM的预测效果,表明其优于标准LSTM。
### 2. 分析方法
#### 2.1. ARIMA模型
ARIMA模型最初由Box等人提出,是一种结合自回归(AR)和移动平均(MA)模型的统计模型,用于概率性预测时间序列数据。具体而言,ARIMA模型通过ARMA(自回归积分移动平均)框架结合AR模型和MA模型,利用过去的信息来识别当前和未来值之间的内在关系。AR模型通过利用自身过去的信息进行表达,而MA模型则通过过去误差的加权和进行表达。在本研究中,ARIMA模型的参数选择和训练过程包括对数据的平稳性分析。数据平稳性评估通过扩展的Augmented Dickey-Fuller(ADF)检验完成。非平稳数据通过差分处理直到其变得平稳,此时差分次数d(p值小于0.05)被应用。此外,数据平稳性通过自相关函数(ACF)和偏自相关函数(PACF)进行验证。参数p和q的确定基于组合后得到的Akaike信息准则(AIC)和贝叶斯信息准则(BIC)的最小值,这可以通过Python的auto.arima函数进行有效确定。ARIMA模型适用于单变量时间序列,而ARIMAX(带有外生变量的自回归移动平均模型)可以处理多变量时间序列,通过引入额外的外生变量来提高模型的性能。ARIMAX模型考虑了各种外生条件与因变量之间的关系,从而增强了模型的长期预测能力。然而,在考虑外生变量时,必须在应用前分析其在模型中的重要性及其未来的可用性。
#### 2.2. LSTM模型
长短期记忆(LSTM)模型是一种神经网络,旨在解决传统循环神经网络(RNN)中常见的长时依赖问题。LSTM单元的内部结构,如图1所示,代表了时间t的隐藏层。这里,xt表示时间步t的输入向量,ht?1和ht分别表示时间步t?1和t的隐藏状态向量,用于管理短期记忆信息。同样,ct?1和ct表示时间步t?1和t的细胞状态向量,用于处理长期记忆信息。在LSTM单元中,各种机制处理输入向量和隐藏状态向量。这些操作通过方程(4)到(9)进行定义。ft表示遗忘门向量,由Sigmoid函数激活,取值在0到1之间。因此,如果之前的细胞状态向量ct?1被认为需要记忆,则其值会接近1;如果被认为不需要,则其值会接近0。细胞状态向量ct由时间步t?1的细胞状态向量与遗忘门向量的逐元素乘法,以及输入门向量和细胞输入向量的逐元素乘法组合而成。最终的隐藏状态向量ht,通过应用tanh激活函数对细胞状态向量进行处理,并与输出门向量进行逐元素相乘,从而得到。
#### 2.3. 注意力机制
在神经网络中,注意力机制通过学习的加权平均来处理输入,而不是预先定义的权重。这种机制类似于一种记忆,通过关注不同时间点的输入来累积信息。注意力机制的主要目标是增强输入特征的提取,使模型能够准确表示数据中的复杂动态。注意力机制的一个关键方面是其能够选择性地关注特定的特征,从而有效减少模型中的瓶颈。此外,注意力机制通常通过在编码器和解码器之间建立直接连接来解决梯度消失问题。如图2所示,该图展示了注意力机制的架构,包括输入、注意力得分及其分布,以及输出。
注意力机制由Bahdanau等人提出,涉及几个关键过程:计算注意力得分、分配优先权重、分布上下文向量。这些过程按定义的顺序执行。首先,注意力得分基于输入序列中各部分与当前输出在特定位置t的匹配程度进行计算。该计算,记作et,i,考虑了编码的隐藏状态hi和之前的解码器输出St?1。函数a(·),可能通过前馈神经网络实现,如方程(10)所示。
在计算注意力得分后,应用softmax运算符来确定权重αt,i,如方程(11)所示。随后,通过加权求和这些权重与编码器隐藏状态的乘积,得到唯一的上下文向量ct。该上下文向量随后在每个时间步被输入到解码器中,如方程(12)所示。这里,ct表示解码器时间步t的上下文向量,它捕获了所有编码器隐藏状态hi的加权和,其中权重αt,i反映了每个编码器状态对当前解码步骤的相关性。该向量本质上总结了整个输入序列中最相关的信息,以帮助解码器在时间t生成适当的输出。值得注意的是,注意力机制通过减少内存需求和最小化无关或噪声数据的影响,提高了计算效率。这使得在处理复杂的输入输出关系任务时,模型能够更加精确和高效地建模。
#### 2.4. 基于注意力的LSTM
如前所述,虽然LSTM网络解决了RNN的一些弱点,但它们仍有局限性。例如,LSTM网络在处理约20步以内的序列时效果良好,但在更长的序列上表现不佳。此外,传统的LSTM模型在提供现实和准确的预测方面有时表现不足。为克服这些挑战,我们将在LSTM网络中集成注意力机制,形成一种增强的模型,称为基于注意力的LSTM(ATLSTM)。这种集成旨在纠正传统RNN的缺陷,并优化LSTM架构以提高预测精度。ATLSTM的结构,包括注意力单元和LSTM层的内部配置,如图3所示。所提出的ATLSTM网络架构包括五个顺序层:输入层、LSTM层、注意力层、密集层和输出层。输入层最初接收数据点,随后在LSTM层中,长短期记忆单元将输入转换为精炼的特征。注意力层随后计算一个权重向量,强调隐藏状态信息中更重要的权重,影响所有后续的隐藏状态。密集层,以其全连接的特性,将每一层的神经元与下一层的每个神经元连接。最终,输出层利用特征向量来分析和预测时间序列数据。
将注意力机制集成到LSTM框架中,有助于处理长序列数据,提供一种动态解决方案,以增强数据可解释性。这种方法允许对输入数据的关键部分进行更细致的权重分配,从而实现更精确和准确的预测,特别是在生产环境中。通过将LSTM与注意力机制结合,模型不仅保留了其在时间序列数据中的有效性,还在存在噪声数据的情况下显著提高了预测精度。本研究通过探索将注意力机制集成到LSTM网络中的方法,为该领域做出了重要贡献,包括注意力层的放置策略(是否在密集层之前或在Dropout层之后)以及注意力层数量的优化。
### 3. 方法论
#### 3.1. 数据描述与预处理
通常,土钉墙的变形是通过安装在开挖现场的引导轮固定系列倾角计进行测量的。倾角计的长度取决于开挖深度,而系列倾角计的间距为0.5或1米。倾角计的底部固定在不可移动层,其水平位移设为零,以计算墙体的相对位移。位移随后在每个点上以定期时间间隔进行测量。如图4所示,使用倾角计探针测量土钉墙位移的过程如下。
在本研究中,我们使用了来自三个不同开挖现场的时间序列数据,如图5所示。这些数据涵盖了每个现场的完整代表剖面,每个时间序列在开挖持续时间、深度和数据点数量上有所不同。倾角计时间序列的模式也因深度而异。使用这三个现场(标记为ES1、ES2和ES3)的时间序列数据,我们进行了多种实验,如表1所示,总共进行了六次实验。这种方法使我们能够分析土钉墙变形的特性,并详细比较传统统计模型与深度学习模型,探讨每种方法的优势和劣势。
为了进一步描述这三个监测现场,ES1是一个相对较深的开挖现场,最终深度约为15米。ES1的地层包括人工填土、粘性沉积物和高度风化的花岗岩。该现场的上部具有软到中等坚硬的粘土层,而更深的区域则为密实的粉砂层。地下水位根据钻孔的不同在4到6米之间波动。ES2是三个现场中最深的开挖现场,达到22米。该现场分为两个阶段开挖,主要由风化的花岗岩和密实的粉砂层组成,地下水位位于约6米处。ES3涉及约10米的中等深度开挖,其地面条件主要由填土覆盖风化的粉砂层,具有中等到高相对密度。地下水位在约5到6米处观察到。尽管这些地质条件未直接用作预测模型的输入变量,但它们有助于解释测量时间序列数据中的变形行为。排除这些参数的目的是评估使用仅在开挖期间收集的倾角计数据的时间序列模型的预测能力,从而简化模型并减少解释不确定性。
数据预处理是分析倾角计时间序列数据的初始步骤,如图6所示。鉴于每个现场的开挖持续时间、数据收集间隔和时间序列长度的不同,标准化是必要的。我们对每个剖面的最大开挖深度进行了标准化,如图7所示。在多变量分析中,不同深度的测量被用作外生变量或特征,使我们能够选择所需的变量。开挖深度被标准化到0到1的范围内,标准化值记为hN。倾角计测量被标准化到0到1的范围内,基于最小值和最大值,如方程(16)所示。
为了评估预测模型基于不同深度的土钉墙位移的预测能力,我们在墙体的表面、中间和底部分别建立了分析点,对应hN值为0、0.4和1。
#### 3.2. 输入变量
以往的研究中使用了多种变量,包括地面信息和数值分析结果来预测土钉墙的变形。然而,本研究主要关注于基于地质测量数据的时间序列分析,有意排除了地面调查和结构数据作为输入变量,以减少模型解释的不确定性。仅使用特定深度的倾角计测量,这些测量在单变量模型中被标记为输入变量,而在多变量模型中被作为外生变量或特征。图8显示了单变量和多变量预测模型中使用的输入变量(hN 0到10)的值。因此,预测模型被建立在每个标准化深度值hN上,并用于预测土钉墙整个深度的变形。为了明确单变量和多变量模型的输入变量结构和标准化策略,表2提供了详细的总结。单变量模型仅使用目标深度的时间序列数据(例如,hN = 0.5),而多变量模型则使用所有标准化深度值从hN = 0到hN = 1(共11个深度等级)。在两种情况下,数据标准化都是在0到1的范围内进行的,但在多变量输入中,标准化是按每个深度等级单独进行的,以保留深度间的相对变化。因此,多变量模型结构使模型能够通过使用相邻的倾角计测量来学习空间变形模式,而单变量模型则仅依赖于单一深度的时间模式。
#### 3.3. 模型结构与超参数选择
为了建立有效的土钉墙时间序列变形预测框架,采用了两种深度学习架构并进行了优化:传统的LSTM模型和基于注意力的LSTM(ATLSTM)模型。每种模型的架构都被精心设计,以捕捉倾角计测量数据中的短期和长期时间依赖性。
LSTM模型由一个处理预定义窗口大小的长短期记忆层组成。该层从输入序列中提取时间特征,并将其传递到一个Dropout层,该层通过在训练期间随机停用一部分单元来防止过拟合。最终的预测通过一个完全连接的密集层得出,该层输出单个位移值。相比之下,基于注意力的LSTM(ATLSTM)模型通过引入多个堆叠的LSTM层来扩展基本LSTM的结构,每个层被配置为返回序列。这是使注意力机制在序列的隐藏状态上运行所必需的。在最终的LSTM层之后,应用注意力机制来计算输入序列中每个时间步的相对重要性。注意力权重通过softmax函数分配,使模型能够更重视对预测任务更有信息的时间步。这些加权特征随后通过加权求和进行汇总,再通过一个密集层生成最终输出。
为了确定最佳模型配置,进行了全面的超参数敏感性分析。探索的四个关键参数包括LSTM层数(1到5层)、每层的隐藏单元数(5到50个)、批量大小(16、32、64、128)和学习率(从1e?4到1e?2)。图9展示了两个热图,可视化了这些参数对模型性能的影响,通过验证集上的平均绝对误差(MAE)进行测量。结果表明,对于ATLSTM模型,最佳性能是使用两层LSTM,每层10个隐藏单元。增加层数或单元数超过此配置并未带来进一步的改进,有时甚至因过拟合而降低性能。此外,使用较小的批量大小(16或32)和较低的学习率(1e?4到1e?3)的模型表现出更稳定的收敛性和较低的验证误差。相比之下,大批量大小和高学习率导致训练行为不稳定和误差增加。基于此分析,最终选择的ATLSTM模型配置为两层LSTM,每层10个隐藏单元,批量大小为32,学习率为0.001。这些设置在后续实验中保持一致,以确保高准确性和稳定的泛化性能。
为了进一步评估模型的实时适用性,我们测量了它们的计算效率,包括训练时间和推理延迟。在配备Intel Core i9-12900K CPU(3.2 GHz)、64 GB RAM和NVIDIA RTX 3090 GPU的系统上,传统LSTM模型的训练时间约为2.8秒,每个样本的推理时间为0.003秒。ATLSTM模型的训练时间稍长,为3.1秒,推理时间为0.01秒。这些结果表明,这两种模型,尤其是其快速的推理速度,计算负担较轻,适合实际中的实时变形监测应用。
#### 3.4. 模型训练与评估
按照上述步骤,原始数据可以被预处理以准备标准化为每日间隔的时间序列数据。当将时间序列数据应用于深度学习模型时,需要定义窗口大小(W),该窗口大小设定了模型考虑的过去信息范围。在本研究中,LSTM模型能够回忆的过去信息量通过设置W在5到25之间进行迭代实验确定,最佳性能出现在窗口大小为5和10的情况下。在模型训练中,20%的整个数据集被指定为测试数据集,其余数据作为训练数据集。例如,对于ES1现场,2021年6月24日至2021年11月26日作为训练数据,而2021年11月27日至2022年1月4日作为测试数据。为了防止过拟合,20%的训练数据被用作验证数据。
为了验证所提出的模型的收敛性和训练稳定性,绘制了LSTM和ATLSTM模型的训练和验证损失曲线,如图10所示。两种模型的训练损失在最初的几个epoch内迅速下降,并在此后继续稳定收敛。验证损失也紧随训练损失,表明没有发生显著的过拟合。特别是,LSTM模型在整体损失值上较低,并且收敛速度更快,而ATLSTM模型在验证损失上稍高,但训练过程中保持了一致的稳定性。这些结果支持了两种模型都被良好正则化并有效训练,确保了后续预测性能的可靠性。
最终的预测结果通过三种常见的性能指标进行评估:均方根误差(RMSE)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)。MAE是绝对误差的平均值,提供直观的误差评估,但对误差的大小不敏感。RMSE减少了低估项的扭曲,较小的值表示更高的精度。MAPE以MAE的比率形式表示,有助于跨模型的误差比较。
### 4. 结果与讨论
#### 4.1. ARIMA和LSTM的预测结果
在本研究中,使用ARIMA和单变量LSTM模型对不同深度的倾角计数据进行了时间序列分析。在使用ARIMA模型之前,需要确认数据的平稳性。如图11所示,自相关系数(ACF)在滞后13时超过可接受范围,显示出随着滞后期增加而逐渐下降的趋势,表明数据是非平稳的。偏自相关函数(PACF)在第三滞后后收敛于零,差分阶数d估计为2,之后的Dickey-Fuller检验得到p值小于0.05,确认数据可以通过差分转换为平稳性。参数p和q通过迭代测试进行优化,最终选择4、2和3作为p、d和q。
图12展示了ARIMA和LSTM模型在测试数据集上的预测结果。MAPE分别为5.6042%和1.5259%,表明LSTM模型的总体性能更优。LSTM还显示了较低的RMSE和MAE,表明预测误差较小。然而,ARIMA在短期预测中表现出优势。图13展示了最大位移深度的测量值和预测值。在测试期的前4天,ARIMA模型表现更好,但在整个36天的预测期间,LSTM预测的实际测量值显示出相似的模式,并在MAPE指标上表现出优越的长期预测性能。ARIMA模型在短时预测中有效,但随着时间推移,其准确性下降。ARIMA假设过去模式在将来会重复,而土钉墙位移的倾角计数据本质上是非平稳的,显示最近的测量与当前值的相关性更大。因此,ARIMA需要通过差分转换以在短时预测中有效,而在测量值发生突变时需谨慎,因为这可能导致显著误差。LSTM模型在短时和长时预测中表现出色,尤其是在非平稳数据如土钉墙位移中。
#### 4.2. 基于时间序列长度的预测结果
在本研究中,我们研究了序列长度(L)对时间序列预测模型性能的影响。序列长度表示时间序列预测模型可以学习的信息量,从而影响其性能。通过将基于日的数据上采样到序列长度为300、500和1000,调整了时间序列数据的分辨率,以探索其对预测模型的影响。随着L值的增加,ARIMA模型的参数被重新选择以优化性能,而LSTM的窗口大小被固定为30。图15展示了随着L值增加,MAPE的变化,表明两种预测模型的误差减少,整体性能提高。LSTM在序列长度增加时,短时和长时预测性能都得到显著提升,而ARIMA则没有显示出显著的改善。
图16展示了测试数据的实际和预测值。对于ARIMA,随着L值的增加,预测性能略有改善,但长时预测能力并未显著提高。此外,观察到在5天内的短时预测性能下降。相反,LSTM在L增加时,短时和长时预测性能都得到提升。短时预测性能在L为500时有所改善,而当L达到1000时,长时预测性能相较于短时预测显著提升。因此,通过数据增强调整时间序列数据的分辨率似乎有助于提升短时和长时预测性能。这表明,增加序列长度对数据模式的精细表示能够有效提升预测能力。对于ARIMA,保持原始时间序列数据的时间间隔在构建预测模型时至关重要,使用原始数据并通过参数调整,而不是上采样,被认为更合适。这种方法可能保留了原始时间模式的完整性,这对于ARIMA模型在时间序列预测中的有效应用至关重要。
#### 4.3. ARIMAX和多变量LSTM的预测结果
在本研究中,我们使用了两种能够进行多变量分析的模型。这些模型使用不同深度的倾角计测量作为外生变量或特征,以在多变量背景下比较预测性能。图17展示了在比较深度上的实际和预测值,而表4提供了预测模型的性能指标。在单变量ARIMA和多变量ARIMAX之间观察到显著的差异。值得注意的是,除了hN = 1外,ARIMAX在预测结果上显示出显著的改善。然而,似乎ARIMA受到其他深度的测量作为外生变量的影响,表明ARIMAX并未真正学习时间序列的动态特性,而是遵循了周围深度的位移模式作为外生变量。这表明,ARIMAX对外生变量的未来变化表现出过度依赖,使其模型过于敏感,可能在实际应用中效果不佳。对于LSTM,单变量和多变量结果之间没有显著差异,表明不同深度的位移值通常遵循相似的模式,因此对预测影响不大。通常,多变量LSTM使用多个输入变量,以提高预测能力。然而,在倾角计位移数据的情况下,由于时间变化较小且模式相对简单,深度特定的测量并未提供额外的预测价值。因此,使用单变量LSTM模型来聚合不同深度的预测以预测整个土钉墙的变形被认为是有用的。
#### 4.4. LSTM与ATLSTM的预测结果比较
在本研究中,通过实验4比较了集成注意力机制的LSTM(ATLSTM)与标准LSTM的预测结果。图18展示了两种模型在三个比较深度上的预测结果。两种模型在三个比较深度上都表现出高性能,但ATLSTM在所有情况下都比标准LSTM更接近实际测量值。这表明ATLSTM在测试数据上提升了短期和长期预测性能。这种改进归因于注意力机制在训练过程中能够专注于序列中的重要部分。注意力减少了LSTM需要处理的信息量,通过集中在特定时间的最关键信息上,从而提高了短期和长期预测性能。这种自适应加权对于时间序列中数据模式发生显著变化的点特别有益。
#### 4.5. LSTM与ATLSTM的泛化性能比较
在本研究中,我们测试了LSTM和基于注意力的LSTM(ATLSTM)模型在开挖现场ES1的训练数据上对新现场ES2和ES3的泛化性能。图20展示了LSTM和ATLSTM模型在新现场上的预测结果,表6提供了预测模型的性能指标。在所有情况下,ATLSTM都表现出更优的性能。值得注意的是,在ES2现场,由于其显著的位移发生在hN = 0.4处,LSTM的MAPE为21.2106%,而ATLSTM的MAPE为5.9002%,表明ATLSTM的预测性能显著提高。同样,在ES3现场,LSTM的MAPE为5.0654%,而ATLSTM的MAPE为1.3489%,表明ATLSTM在一致深度上具有增强的性能。虽然在ES3现场的时间序列模式总体上呈逐渐上升趋势,但可能因测量噪声或安装延迟而表现出波动。尽管如此,提出的ATLSTM模型仍表现出相对稳定的性能,表明其对测量噪声具有鲁棒性。这可能归因于注意力机制的内在能力,使其能够专注于关键时间点的信息,同时降低无关或噪声部分的权重。然而,这一假设是基于预测准确性和定性评估推断出来的。未来的研究将探讨模型在不同噪声水平下的鲁棒性评估。
### 5. 局限性与未来工作
本研究提出了一个仅使用开挖现场倾角计时间序列数据的土钉墙变形预测模型。通过专注于传感器衍生的时间数据,该模型减少了传统数值或数据驱动方法中广泛输入变量带来的不确定性。因此,该方法在实际施工环境中监测土钉墙变形的实用性得到了证明,提供了一种轻量级且可部署的替代方案。然而,仍存在一些局限性。首先,排除了地面调查数据(如剪切强度、单位重量、地下水位)和结构参数,使得模型在设计阶段的应用不够理想,因为设计阶段需要详细的地质评估和安全性因素评估。虽然这种简化对于现场应用是有利的,但它限制了模型的可解释性和诊断能力,尤其是在尝试识别不寻常的墙体运动原因时。其次,尽管模型在三个监测现场上表现出色,但其对未见过的开挖现场的泛化能力仍然是一个挑战。当前模型是在有限的地质和施工条件数据集上训练的,为了更广泛的应用,未来的工作必须包括更多种类的开挖案例,包括涉及不同地质类型、支撑系统和施工方法的案例。值得注意的是,在图22中,ES2现场的变形模式偏离了地质行为中常见的侧向位移形状。这种不典型的时序数据可能包含现场诱导的噪声,如倾角计管体扭曲、安装不当或支撑延迟。尽管如此,提出的ATLSTM模型仍表现出相对稳定的性能,表明其对测量噪声具有鲁棒性。这可能归因于注意力机制的内在能力,使其能够专注于关键时间点的信息,同时降低无关或噪声部分的权重。然而,这一假设是基于预测准确性和定性评估推断出来的。未来的研究将探讨模型在不同噪声水平下的鲁棒性评估。此外,当前模型尚未在表示故障场景的数据集上进行训练。虽然典型开挖现场被管理以防止不稳定性,但墙体倒塌或故障场景可能表现出根本不同的时序行为。因此,未来的工作应探索包括异常或故障条件数据在内的模型改进,以增强模型在早期预警或风险检测方面的能力。最后,本研究未涉及模型在地震载荷条件下的适用性。鉴于地震韧性在岩土设计中的日益重要,将地震相关参数纳入模型并评估模型在地震激励下的性能仍是一个重要的未来研究方向。总之,虽然提出的方法在简化和提升土钉墙变形的实时监测方面做出了贡献,但未来的研究仍需改进模型的泛化能力、可解释性和鲁棒性,特别是在极端或不典型条件下。
### 6. 结论
在本研究中,我们使用开挖现场的倾角计测量数据构建并比较了两种预测模型:ARIMA和LSTM。目标是评估土钉墙的稳定性,并通过时间序列分析预测未来的位移,探讨传统统计方法与深度学习方法之间的差异,并旨在提高其准确性。研究的主要结论如下:
1. 在各种测试中,LSTM模型始终优于ARIMA模型,尤其是在长期预测中。这表明LSTM能够有效地建模时间序列数据中的非线性模式和长期依赖性。
2. 对序列长度对模型性能影响的分析表明,随着序列长度的增加,LSTM的预测性能有更显著的提升。相比之下,ARIMA在较长的序列长度下没有显示出显著的改善。因此,对于长期预测地下位移变化,LSTM似乎更合适。
3. 虽然LSTM在短期预测中存在一些不足,但这些不足可以通过数据增强技术如上采样来缓解。这使得LSTM在短期和长期预测中都表现出高度的灵活性和适应性,成为一种能够适应开挖现场各种变化的稳健预测工具。
4. 虽然ARIMA在短期预测中表现出优势,但它在处理非平稳数据方面存在局限,并且需要持续调整和更新模型参数。另一方面,LSTM能够有效处理非平稳数据,并且通过数据增强和注意力机制的应用,可以提高其短期和长期预测性能以及泛化能力。特别是对于具有高波动性和变化模式的时间序列数据,使用ATLSTM可以优先处理关键数据点,从而显著提高预测精度。
因此,在实际应用如开挖现场监测中,使用LSTM可能更有效。通过LSTM进行实时监测和预测可以提高开挖作业的效率,并通过预测洞察力实现基于数据的快速决策,从而潜在地减少财产损失和人员伤亡的风险。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号