基于机器学习的孔隙度预测:以新西兰坎特伯雷盆地白垩纪马塔系列地层为例的研究
《Physics and Chemistry of the Earth, Parts A/B/C》:Machine learning-driven porosity prediction: A case study from the Cretaceous Mata Series, Canterbury Basin, New Zealand
【字体:
大
中
小
】
时间:2025年10月23日
来源:Physics and Chemistry of the Earth, Parts A/B/C 3.0
编辑推荐:
预测坎特伯雷盆地玛塔系列储层孔隙度的挑战及机器学习模型集成方法。采用MLR、ANN、LSTM和XGBoost四类模型,基于GR、NPHI、RHOB、DT四类测井数据,XGBoost模型表现最佳(R2=0.9976,RMSE=0.0028)。研究证实机器学习可有效解决高异质性储层孔隙度预测难题,填补数据稀缺环境下的技术空白。
在新西兰坎特伯雷盆地的白垩纪马塔组(Mata Series)的陆上区域,进行孔隙度测量的预测和验证是一项具有挑战性的任务。该区域的地质条件复杂,马塔组地层厚度大,内部包含多个储层岩性,沉积环境多样,潜在储层的厚度和深度变化显著。这些因素使得传统的孔隙度评估方法在该区域的应用受到限制。为此,研究人员提出了一种基于机器学习的新方法,以提高在复杂地质条件下孔隙度预测的效率和准确性。
孔隙度是储层评价中的一个核心参数,直接影响到油气储藏能力的评估。因此,准确预测孔隙度对于地质勘探、储层描述以及资源估算具有重要意义。然而,孔隙度的预测并非易事,尤其是在数据不足或质量较低的区域。传统方法主要依赖于岩心实验室分析和常规测井数据的解释,虽然这些方法在某些情况下被认为是可靠的,但它们也存在明显的局限性。例如,岩心分析虽然精度较高,但成本高昂、耗时较长,并且在提取过程中容易受到污染影响。此外,测井数据的获取也受到多种因素的制约,如测井设备的限制、测井作业的经济成本等。
在坎特伯雷盆地这样的前沿盆地中,上述挑战尤为突出。该盆地的沉积层序受一系列构造活动、海进和海退事件的影响,导致地下岩性高度异质,储层分布不均。这种复杂的地质结构使得传统的储层评价方法难以有效应用。在马塔组中,由于测井数据的不完整性以及岩心样本的稀缺性,孔隙度的准确预测变得尤为困难。因此,迫切需要一种能够克服这些局限性的方法,以提高勘探和开发的成功率。
近年来,随着人工智能和机器学习技术的发展,这些方法在石油地质领域得到了广泛应用。特别是在处理非线性关系和复杂数据模式方面,机器学习展现出独特的优势。例如,人工神经网络(ANN)能够学习测井数据与孔隙度之间的非线性关系,而长短期记忆网络(LSTM)则擅长处理具有时间序列特征的数据。此外,极端梯度提升(XGBoost)在处理表格数据方面表现出色,能够捕捉输入特征之间的复杂交互关系。这些模型在不同石油盆地的孔隙度预测中取得了显著成果,但它们在坎特伯雷盆地的应用尚属首次。
本研究的主要目标是开发一种结合多种机器学习算法的混合框架,以提高坎特伯雷盆地马塔组中孔隙度预测的准确性。研究人员选取了五口井(Resolution-01、Clipper-01、Endeavour-01、Galleon-01 和 Caravel-01)的测井数据,包括伽马射线(GR)、声波时差(DT)、中子孔隙度(NPHI)和体积密度(RHOB)等四种常用测井曲线。这些测井数据在该区域广泛存在,并且与孔隙度具有较高的相关性,因此被选为输入特征。通过对这些数据的分析,研究团队评估了四种机器学习模型在孔隙度预测中的表现,包括多元线性回归(MLR)、人工神经网络(ANN)、长短期记忆网络(LSTM)和极端梯度提升(XGBoost)。
研究结果表明,XGBoost模型在所有测试模型中表现最佳,其决定系数(R2)达到0.9976,均方根误差(RMSE)为0.0028,显示出极高的预测精度。相比之下,多元线性回归(MLR)的预测效果最弱,R2值为0.9384,RMSE为0.0143。人工神经网络(ANN)和长短期记忆网络(LSTM)也表现出良好的性能,分别获得了R2值为0.9751和0.9876。所有模型的R2值均高于0.90,表明它们在孔隙度预测方面具有较高的准确性。
为了验证这些模型的预测能力,研究人员采用了“拟合度曲线”(Cfit curves)作为评估工具。Cfit曲线是一种通过将实测孔隙度与预测孔隙度在深度方向上进行直接对比的方法,能够直观地展示两种孔隙度曲线之间的匹配程度。这种可视化评估方式有助于研究人员更全面地理解模型的预测效果,并识别可能存在的误差来源。
本研究的创新之处在于,它首次在坎特伯雷盆地的马塔组中应用了机器学习方法进行孔隙度预测。同时,研究团队将多种算法结合,构建了一个综合性的预测框架,以充分发挥每种算法的优势。这种混合方法不仅弥补了传统方法在复杂地质条件下的不足,还提供了一种成本效益高、可扩展性强且分辨率高的解决方案。特别是在数据稀缺的前沿区域,这种方法能够有效填补测井数据的空白,为储层的综合评价提供可靠的依据。
此外,本研究还强调了机器学习方法在处理测井数据方面的潜力。与以往仅依赖地震数据或单一算法的研究不同,本研究通过多口井的数据进行验证,涵盖了多种岩性条件,从而提高了模型的普适性和可靠性。研究团队生成的PHIT曲线(即预测孔隙度曲线)不仅填补了因测井数据不完整或质量较低而产生的数据空白,还为储层的连续性描述提供了统一的孔隙度模型。这些成果为未来的勘探和开发工作提供了重要的参考价值。
在应用机器学习方法进行孔隙度预测的过程中,研究团队也注意到了一些局限性。首先,由于测井数据的分布较为稀疏,模型的预测结果只能作为相对估算,无法完全替代岩心分析的绝对精度。其次,尽管机器学习方法在处理非线性关系和复杂模式方面具有优势,但它们的性能仍然依赖于输入数据的质量和特征选择的合理性。因此,在实际应用中,需要结合地质和地球物理知识,对输入数据进行合理的筛选和处理,以确保模型的准确性。
本研究的意义不仅在于提供了坎特伯雷盆地马塔组孔隙度预测的新方法,还为其他类似地质条件的前沿盆地提供了可借鉴的经验。研究人员强调,将测井数据与机器学习技术相结合,有助于更深入地理解储层特性,从而提高勘探和开发决策的科学性和可靠性。随着技术的不断进步和数据的持续积累,机器学习方法在石油地质领域的应用前景将更加广阔。
总体而言,本研究通过引入多种机器学习模型,成功地提高了坎特伯雷盆地马塔组孔隙度预测的准确性。研究结果表明,这些模型能够在复杂地质条件下提供可靠的预测,为储层评价和资源勘探提供了新的思路和技术手段。未来,随着更多数据的获取和模型的优化,机器学习方法有望在更广泛的地质环境中得到应用,为全球石油勘探和开发带来更多的可能性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号