在能源勘探与开发中,基于深度学习的声学测井信号重建技术
《Frontiers in Earth Science》:Deep learning driven reconstruction of acoustic logging signal in energy exploration and development
【字体:
大
中
小
】
时间:2025年10月18日
来源:Frontiers in Earth Science
编辑推荐:
测井曲线重建中,针对钻井液侵入和井壁坍塌导致的数据缺失或失真问题,提出融合变分模态分解(VMD)、卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)的混合模型。通过XGBoost-SHAP方法优化特征选择,构建针对DT信号的预测模型,实验表明该模型在两个测试井的拟合优度(R2)分别达到0.71和0.88,且在均方误差(MSE)、均方根误差(MAE)、平均绝对百分比误差(MAPE)等指标上显著优于SVR、随机森林和LSTM方法。
在油气勘探与开发过程中,测井曲线是获取地下地质信息的关键数据。然而,在实际采集过程中,由于钻井液侵入、井眼坍塌等不利因素的影响,测井数据常常出现缺失或失真,这给后续的分析与应用带来了诸多挑战。测井曲线具有显著的上下文依赖性,传统重建方法大多基于数据独立同分布的假设,难以捕捉数据之间的时序依赖关系,从而限制了时间序列建模的准确性。为此,本文针对某东北地区页岩储层,提出一种结合变分模态分解(VMD)、卷积神经网络(CNN)和双向长短期记忆神经网络(BiLSTM)的方法,以实现对测井声波信号(DT)的高精度重建。VMD方法通过将测井曲线分解为不同尺度的模态函数(IMF),实现不同频率特征的提取;CNN方法用于提取IMF中的局部特征,如局部形态和变化趋势,获得高层次的特征表示;BiLSTM则用于提取特征的双向长期依赖关系。通过标准化测井数据,避免了人工选择输入测井曲线的主观性,引入了XGBoost-SHAP方法优化测井曲线,构建了一个以DT为目标的梯度提升回归模型,并利用SHAP值开展基于博弈论的特征贡献分析,获取基于累积SHAP贡献的特征排序。最终,选择了三个敏感曲线CNL、GR和RS作为输入特征,构建了VMD-CNN-BiLSTM预测模型,并将其应用于两口测试井,取得了R2值分别为0.71和0.88的拟合效果。进一步的对比实验表明,VMD-CNN-BiLSTM模型在MSE、MAE、MAPE、R2等指标上相较于SVR、随机森林和LSTM方法均表现出显著的性能提升。具体而言,MSE降低了20.5–33.9,MAE降低了1.5–2.1,MAPE降低了1.6%–2.3%,R2提升了0.21–0.36。
测井曲线是石油勘探中不可或缺的地质数据,它们通过岩石结构的解释、储层参数的确定和地震反演等过程,为形成评价提供支持。其中,声波测井曲线直接反映了岩石骨架的弹性模量和孔隙流体的压缩性,记录了岩石中纵波传播时间。它们主要用于合成地震记录、岩性识别、孔隙度计算和岩石力学参数的计算。然而,在实际测井过程中,由于井壁坍塌、仪器故障等干扰因素,导致测井曲线出现缺失或失真,增加了后续地质工作的难度。鉴于重新测井的高成本和工程难度,如何实现测井曲线的重建已成为油气储层勘探开发中的关键环节。
为解决这一问题,早期研究人员主要采用传统方法进行曲线重建,如经验公式、岩石物理建模和多元回归等。这些方法在统计规律的基础上对曲线进行初步估算,但在面对复杂地质条件下测井数据与目标变量之间明显的非线性关系和显著的空间序列特征时,重建精度明显不足。随着机器学习的发展,相关算法在石油领域得到了广泛应用。K近邻、支持向量机、随机森林和XGBoost等机器学习算法已被广泛用于相关研究。这些算法能够挖掘数据中的复杂非线性关系,从而在一定程度上提高重建精度。然而,以“点对点预测”为主的范式存在根本性缺陷,即它们将时间序列视为独立同分布的观测点,破坏了其固有的时间连续性。例如,KNN仅依赖数值相似性,忽略了上下文顺序,容易找到错误的历史相似点;随机森林通过自助采样和随机特征选择破坏了时间顺序,其模型结构无法有效维持或记忆长期时间状态。因此,这些方法在系统性捕捉时间依赖性方面存在困难。
深度学习作为机器学习的重要分支,为测井曲线的重建提供了新的解决方案。代表性的深度学习模型如卷积神经网络(CNN)和循环神经网络(RNN、LSTM)已被广泛引入该领域。CNN能够有效提取测井数据的空域特征,并探索不同参数之间的相关性;RNN及其变体擅长处理时间序列数据,能够捕捉测井曲线随深度变化的信息,适用于测井曲线的重建任务。本文在该领域提出了关键贡献:
1. 采用XGBoost-SHAP方法进行基于可解释性的特征选择。该方法能够有效提取特征变量与目标变量之间的非线性关系,并探索多变量交互效应对预测结果的影响。
2. 引入一种结合软动态时间规整损失(Soft-DTW)和均方误差损失(MSE)的综合损失函数。Soft-DTW用于衡量预测曲线与实际曲线的全局相似性,而MSE用于衡量单点误差。这两种损失的结合有助于更好地平衡测井曲线点的离散误差和整体趋势误差。
3. 利用VMD将输入和目标曲线分解为多频成分,为每个成分构建CNN-BiLSTM模型,并通过叠加预测成分来重建最终曲线。
本文的研究成果不仅提高了测井曲线重建的精度,还拓展了深度学习在石油工程中的应用。通过特征选择和模型构建,实现了对测井数据的深度挖掘,提升了对复杂地质结构的识别能力。此外,模型的泛化能力和稳定性也得到了显著增强,能够在不同深度和不同地质条件下保持较高的预测性能。VMD-CNN-BiLSTM模型在处理测井曲线的非线性特征和长期依赖关系方面表现出色,能够有效捕捉测井数据的全局趋势和局部变化。这种多尺度分析方法为测井曲线的重建提供了新的视角和方法,有助于更准确地反映地下岩层的物理特性。
在实际应用中,VMD-CNN-BiLSTM模型被应用于两口测试井,取得了良好的重建效果。具体而言,模型在SYY1井和YX58井上的R2值分别为0.8783和0.7142,显示出其在测井曲线重建中的有效性。通过与传统方法(如SVR、随机森林和LSTM)的对比实验,VMD-CNN-BiLSTM模型在多个指标上均表现出显著的优势,例如MSE降低了20.5–33.9,MAE降低了1.5–2.1,MAPE降低了1.6%–2.3%,R2提升了0.21–0.36。这些结果表明,VMD-CNN-BiLSTM模型在测井曲线的重建任务中具有更高的精度和稳定性。
此外,模型的可解释性也得到了提升。通过XGBoost-SHAP方法,对各输入特征的贡献进行了量化分析,并通过SHAP值进行博弈论解释,从而确定了对DT预测具有显著影响的特征。研究结果表明,CNL具有最高的SHAP值(5.43),其次是RS和GR,分别为1.52和1.30,而DEN和RD的SHAP值较低,分别为0.99和0.82。这表明CNL、RS和GR在DT预测中具有更高的敏感性,可能与它们对储层孔隙度的直接反映有关。通过这些特征的筛选,模型能够更有效地捕捉测井曲线的非线性关系,提高预测的准确性。
在实验过程中,首先对收集的测井曲线进行了预处理,包括异常值去除和标准化。随后,采用VMD对优化后的CNL、RS和GR曲线进行分解,并对目标DT曲线也进行分解。在此基础上,为每个分解后的IMF分量构建预测模型,最后通过叠加所有预测结果,获得最终的重建曲线。该方法有效结合了VMD的多频分解能力、CNN的局部特征提取能力以及BiLSTM的双向时间依赖性捕捉能力,从而在复杂地质条件下实现了对测井曲线的高精度重建。
模型的训练和评估基于特定的计算机配置,使用了Windows 11操作系统、Python编程语言和TensorFlow深度学习框架。实验设置包括批量大小为32、初始学习率为0.01、λ参数设为0.7以及64个训练迭代。通过分析不同分量预测模型的损失趋势,发现随着训练次数的增加,模型的损失值逐渐下降并趋于稳定,表明模型在训练过程中具有良好的收敛性。
实验结果进一步验证了该方法的有效性。在SYY1井和YX58井的测试中,预测曲线与真实曲线表现出高度的一致性,散点图显示预测值与实际值主要分布在45度对角线上,表明两者的线性一致性较好。R2值分别为0.8783和0.7142,说明模型在重建测井曲线的总体趋势和局部波动方面具有较强的拟合能力。此外,模型能够准确地再现关键特征,如峰值和谷值的位置,表明预测结果与真实数据之间具有良好的一致性。通过对比不同模型在测试井上的预测结果,发现VMD-CNN-BiLSTM模型在拟合度、误差指标和整体趋势匹配方面均优于其他传统方法,证明了其在测井曲线重建任务中的优越性。
综上所述,本文提出的VMD-CNN-BiLSTM模型在测井曲线重建任务中展现出良好的性能和应用前景。该方法不仅解决了传统方法在时间依赖性和非线性关系建模上的不足,还通过引入XGBoost-SHAP方法提升了模型的可解释性。此外,该方法在处理测井曲线时能够有效捕捉局部波动特征、长期趋势和上下文信息,为油气储层的勘探开发提供了可靠的数据支持。未来,该方法还可以进一步优化,以适应更多类型的测井数据和更复杂的地质条件,为测井曲线的重建和应用提供更广泛的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号