基于SOM-MRGC聚类与SHAP优化机器学习的储层表征新方法:以伊朗Kazhdumi组为例

《Results in Engineering》:Novel hybrid SOM-MRGC clustering with SHAP-optimized machine learning for integrated reservoir characterization: A case study of the Kazhdumi Formation

【字体: 时间:2026年01月12日 来源:Results in Engineering 7.9

编辑推荐:

  本文推荐一项针对复杂碳酸盐岩-硅质碎屑岩储层表征的创新研究。为解决传统方法在表征Kazhdumi组等非均质储层时面临的挑战,研究人员开发了一种集成SOM-MRGC聚类、HFU分析和SHAP-LIME可解释机器学习的工作流。该研究成功识别了7种电相,建立了δ13C > +3‰的成岩作用阈值与孔隙度提升22%的定量联系,并实现了高精度渗透率预测(RMSE = 0.12 log(mD))。该工作流显著提高了储层评价精度,为优化钻井和完井策略提供了可靠依据。

  
准确表征非均质碳酸盐岩-硅质碎屑岩储层一直是石油地质科学领域的重大挑战。这类储层具有复杂的孔隙结构、岩性非均质性和多期成岩改造特征,直接影响了油气产能和采收效率。尽管测井技术和计算建模取得了长足进步,但由于沉积环境、成岩改造和构造作用的综合影响,在预测孔隙度、渗透率和流体饱和度等关键岩石物理属性时仍存在不确定性。传统方法的局限性在裂缝性储层、微孔碳酸盐岩和非常规致密地层中尤为突出,传统的孔渗关系往往难以捕捉储层的非均质性。
近期研究展示了核磁共振测井在表征孔隙大小分布和流体识别方面的潜力,尤其在非常规储层中。然而,在具有多模态孔隙系统的碳酸盐岩中,核磁共振衍生参数与岩心测量值之间的差异仍然是一个持续存在的问题。同样,机器学习算法在岩石分类和渗透率预测方面显示出前景,但其有效性往往受限于训练数据集的质量和代表性。传统机器学习应用的一个关键限制是其“黑箱”性质,预测结果缺乏地质可解释性。当前储层表征工作流的一个关键空白是有限考虑岩石物理属性上的地质力学效应。应力相关的渗透率和孔隙压缩性显著影响致密储层中的流体流动,然而这些动态行为在传统模型中常常被过度简化。
为此,研究人员开展了一项创新性研究,旨在通过集成电相分类、地质力学分析和机器学习技术,来表征Kazhdumi组的储层非均质性。该研究的 methodological novelty 主要体现在三个方面:为每个电相开发全面的地质力学剖面以评估可压裂性和井壁稳定性;实施混合机器学习-聚类方法以改进相识别;应用可解释AI方法进行数据有限层段的渗透率预测。
研究人员采用了综合的工作流,该工作流依次集成了多种先进分析技术和验证步骤。首先进行数据采集和预处理,利用LITOSAND(≥50%截断值)进行岩性分离。随后,通过混合SOM-MRGC聚类进行电相识别。最后进行多学科集成和现场应用。研究利用了来自Dezful Embayment 15口井的全面测井数据,以及5口井的岩心数据用于基本验证。数据集经过严格的质量控制程序。一个关键的预处理步骤涉及岩性特异性归一化和基于50%阈值的砂岩标志(LITOSAND)的实现,以分离碳酸盐岩和碎屑岩层段进行专门处理。
电相分类采用了多分辨率图基聚类(Multi-Resolution Graph-Based Clustering, MRGC)算法,基于其独特的岩石物理特征来识别电相。该方法通过计算两个基本指数来识别多维空间中的自然簇:邻域指数(Neighborhood Index, NI)和核代表指数(Kernel Representative Index, KRI)。MRGC算法配置的邻居数(k)范围为15-20,以平衡簇的分辨率和稳定性。最优簇数(k=7)通过KRI趋势的肘部法和针对岩心描述的地质合理性检查相结合确定。
水力流动单元(Hydraulic Flow Unit, HFU)分析采用流动带指标(Flow Zone Indicator, FZI)方法,应用于经过岩心标定的碳酸盐岩层段。该方法基于修改的Kozeny-Carman方程,将多孔介质建模为一束毛细管。计算了储层质量指数(Reservoir Quality Index, RQI)和归一化孔隙度比(φz),然后导出流动带指标(FZI)。使用FZI的对数(LogFZI)来识别不同的水力单元。LogFZI累积频率图中的断点用于客观定义HFU之间的边界。
地质力学参数通过声波测井和密度测量推导得出,为力学地球建模(Mechanical Earth Modeling, MEM)提供了基础。计算了动态杨氏模量(Edyn)和动态泊松比(νdyn)。脆性指数(Brittleness Index, BI)也进行了计算。使用针对碳酸盐岩地层修改的Eaton方法估算孔隙压力。动态到静态属性的转换通过在代表储层的围压(5-30 MPa)下进行的45个岩心样品的三轴试验进行了验证。
在机器学习增强方面,实施了混合SOM-MRGC聚类。自组织映射(Self-Organizing Map, SOM)用于在MRGC聚类之前进行降维,有效解决了过渡相之间的重叠问题。SOM架构由一个10×10的六边形网格组成,使用高斯邻域函数。该映射训练了1000次迭代,初始学习率为0.5,邻域半径为3,在训练过程中线性递减。SOM的降维输出然后输入到MRGC算法中,创建了一种结合两种方法优势的混合方法。
渗透率预测采用了XGBoost算法。该模型通过贝叶斯优化(100次迭代)进行配置,最终确定有500棵树,最大深度为6,学习率为0.05,L2正则化项为1.0。采用SHAP(SHapley Additive exPlanations)分析来量化特征重要性并提供全局和局部可解释性。同时,应用局部可解释模型-无关解释(Local Interpretable Model-agnostic Explanations, LIME)为电相分类提供实例级解释。
4.1. 电相分类及岩石物理属性
初始聚类使用MRGC算法生成了四个初步模型。包含七个不同电相(EF1-EF7)的模型被选为最优,基于其在对声波时差(DT)和含水饱和度(Sw)等基本岩石物理参数的优异分离能力。交会图分析证实了各类别之间存在明显边界。电相7(EF7)始终表现出最有利的储层特征,具有高DT和有效孔隙度(PHIE),以及中等的体积密度(RHOB)值。相反,电相1(EF1)和4(EF4)显示出最差的指标。
将电相划分为碳酸盐岩(EF4-EF7)和砂岩(EF1-EF3)组后,揭示了清晰的储层质量趋势。碳酸盐岩相Sw与PHIE交会图表明,EF7具有最高的有效孔隙度和最低的含水饱和度。相反,EF4表现出最低的孔隙度和完全含水。对于砂岩相,观察到从EF3到EF1有效孔隙度降低和含水饱和度增加的趋势,确立EF3为最好的砂岩相,尽管含水饱和度很高。
复合测井图显示,从EF1到EF7存在一致的趋势:声波时差(DT)和有效孔隙度(PHIE)增加,而体积密度(RHOB)、自然伽马(GR)和含水饱和度(Sw)降低。这一进展证实了储层质量的系统性改善,EF1和EF7分别代表低端和高端。
为了定量评估每个电相的油气潜力,基于岩石物理截断模型生成了水接触场景(Water Contact Scenario, WCS)测井:有效孔隙度(PHIE)大于0.05且含水饱和度(Sw)小于0.55的层段被分类为潜在“产层”,所有其他层段被分类为“非产层”。结果表明,EF1至EF6主要为非产层,主要由于高含水饱和度或孔隙度不足。关键的是,电相7(EF7)被确定为主要产层,其88%的层段满足“产层”标准,直接将其优越的岩石物理属性与已证实的油气潜力相关联。
4.2. 电相频率和分布
对所研究井中电相频率的分析表明,EF3(砂岩)是最普遍的相,而EF1(砂岩)频率最低。总体频率顺序为EF3 > EF4 > EF5 > EF6 > EF7 > EF2 > EF1。考虑到混合岩性,分别对碳酸盐岩段和砂岩段(Burgan段)进行了频率分析。在碳酸盐岩段(EF4-EF7),EF4和EF5最为丰富,而质量最优的EF7频率最低。在砂岩段(EF1-EF3),EF3占绝对主导地位,占层段80%以上,而EF1和EF2合计占不到20%。
4.3. 碳酸盐岩段水力流动单元(HFU)分析
由于仅碳酸盐岩段有岩心孔隙度和渗透率数据,因此将流动带指标(FZI)方法应用于电相EF4-EF7。基于FZI对数(Log FZI)中的断点,识别出四个不同的水力流动单元。从最低质量单元到最高质量单元,观察到平均孔隙度(从HFU1的8.4%增加到HFU4的17.4%)和渗透率(从0.4 mD增加到359.3 mD)的显著增加。每个HFU的孔渗交会图显示,从HFU1到HFU4,相关系数(R2)从0.9114逐步提高到0.9326,表明向更高级别单元储层质量和孔隙系统均匀性增强。
4.4. 电相与水力流动单元的集成
静态电相和动态水力流动单元之间存在强烈的直接相关性。在代表井取心段内将两者集成提供了明确的验证:电相7(EF7),即裂缝-孔洞型碳酸盐岩,与高流动能力HFU4完全对应,而致密的背景电相4(EF4)与非储层HFU1相关。这种一对一匹配(EF5=HFU2, EF6=HFU3)验证了使用连续电相测井来预测未取心段水力流动行为的方法。
4.5. 聚类方法的比较分析
对四种聚类方法——自组织映射(SOM)、MRGC、DYNAMIC和凝聚层次聚类(Agglomerative Hierarchical Clustering, AHC)进行了比较,结果以岩心衍生的HFU为基准进行衡量。MRGC方法在与定义的HFU的匹配方面表现出优异的视觉和定量匹配,确认其作为本研究主要方法的选择,并将模型推广到其他井。
地质力学属性的推导揭示了关键电相之间的明显对比。电相7(EF7)表现出适于水力压裂的理想属性,脆性指数(BI)为0.71,单轴抗压强度(UCS)为82 MPa。与此形成鲜明对比的是,非储层电相4(EF4)显示出显著较低的可压裂性,BI为0.38,UCS较高为68 MPa,将其归类为韧性隔层。EF7的动态杨氏模量在主导走滑应力机制下计算为18.9 GPa,为完井设计和井壁稳定性分析提供了定量基础。
4.6. 具有SHAP和LIME可解释性的机器学习渗透率预测
为解决砂岩段缺乏岩心数据的问题,训练了一个XGBoost机器学习模型,基于可用的碳酸盐岩岩心数据从测井曲线预测渗透率。该模型在测试数据集上实现了高的预测精度,均方根误差(RMSE)为0.12 log(mD),比常规渗透率预测方法提高了40%。为了从全局和局部解释模型,采用了SHAP和LIME分析。
SHAP摘要图提供了全局模型解释,明确确定有效孔隙度(PHIE)是渗透率的主要正驱动因素(平均|SHAP| = 0.62)。更重要的是,SHAP量化了含水饱和度(Sw)和自然伽马(GR)的强负影响。这是一个关键的工程洞察:高Sw表明烃类驱替无效,可能由于小孔喉导致的高毛细管压力,而高GR表示粘土含量,直接堵塞孔隙和流动通道。
为了补充这一全局视图,LIME提供了局部的、实例级的解释。对于EF7层段某个高渗透率预测的特定样本,LIME表明该模型的决策主要由该深度处非常高的PHIE和非常低的Sw值驱动。这种细粒度的解释使工程师能够逐英尺验证模型的逻辑,确保高预测不是虚假相关的产物,而是基于合理的岩石物理原理。
该模型的强大预测能力和可解释性对现场作业产生了直接和可量化的影响。通过提供可靠的、测井衍生的渗透率曲线及其控制因素的清晰理解,该模型使得完井决策更加自信和高效。这直接促进了三口先导井非生产时间(NPT)减少28%,相当于每口井在钻井和完井作业中节省约15-20天。
4.7. 岩石学验证和全油田模型推广
取心段薄片岩石学分析为测井衍生的电相提供了实地验证。砂岩相(Burgan段)分析显示胶结差、疏松的砂粒,含有大量填隙粘土矿物。这种粘土含量是高自然伽马响应、低有效孔隙度和高含水饱和度的主要原因,有效降低了储层质量。碳酸盐岩相表现出明显且具有诊断性的岩石学特征:EF4为致密泥晶灰岩,孔隙度极低;EF5为以粘土为主的泥灰岩至颗粒灰岩;EF6为具有溶蚀孔洞的粒泥灰岩;EF7为具有最高次生孔隙度(包括溶蚀孔洞和裂缝孔隙)的颗粒灰岩-粒泥灰岩,粘土基质少。这直接解释了其优越的测井衍生属性。
最终经过验证的电相模型被推广到整个油田的多口井。全油田对比图表明,高质量相(EF6, EF7)集中在Kazhdumi组上部。储层质量向下的Burgan砂岩段显著变差,该段主要被低质量的EF1-EF3主导。
这项研究的一个关键进展是对薄片中识别的成岩过程进行了地球化学量化。碳酸盐胶结物和基质的稳定碳同位素分析揭示了与高质量EF7相关的明确地球化学特征。来自EF7的样品始终表现出δ13C值大于+3‰(VPDB),这一阈值表明在封闭或半封闭系统中受产甲烷作用影响的白云石化作用。这一地球化学指纹与非储层EF4碳酸盐岩(δ13C值通常在-2‰至+1‰之间)相比,直接与孔隙度增强22%相关。这一定量联系证明,EF7的优越储层质量不是随机现象,而是特定的、化学定义的成岩路径的直接结果,该路径创造了岩石学中观察到的普遍溶蚀和裂缝孔隙。
本研究提出的集成工作流成功解构了Kazhdumi组的复杂非均质性。该研究的新颖性在于其整体的、从成因到生产的综合。它证明EF7的高质量不仅仅是孔隙度的函数,而是由控制流动能力(FZI > 0.6)的特定成岩孔隙类型(裂缝-孔洞型)所控制。此外,XAI的使用带来了石油物理中机器学习应用的范式转变,将其从一个不透明的工具转变为一个透明的伙伴,提供地质上合理且工程上可验证的洞察。
该模型的现场应用为资产开发提供了强大的、可操作的工具体。清晰识别EF7/HFU4(高DT、高PHIE、低GR、低Sw)的主要目标。新井应进行地质导向以最大化钻遇这些单元。EF7的高脆性指数使其成为水力压裂的理想候选者。相反,富含粘土的砂岩(EF1-EF3)必须从射孔层段中排除。该模型能够通过排除具有高孔隙度但无流动潜力的层段来更准确地计算净产层,从而更可靠地估算地质储量(HIIP)。
尽管集成工作流稳健,但仍承认几个固有限制。数据集存在不对称性。砂岩段的渗透率模型仍然是从碳酸盐岩岩心数据训练的模型外推而来。裂缝的表征主要是定性的和间接的。电相在井间的传播代表了构建全油田模型的简化方法。通过解决这些具体途径,该集成表征框架可以从强大的静态分析工具演变为动态的、预测性的系统。
本研究为Kazhdumi组的储层表征提出了一个综合工作流,集成了先进电相分类、成岩分析和机器学习驱动的渗透率预测。混合SOM-MRGC聚类方法成功识别了七个不同的电相,表现出优于常规MRGC方法的性能。通过稳定碳同位素阈值(δ13C > +3‰)对白云石化影响进行量化,揭示了与孔隙度增强(22%)的直接相关性,提供了一个新的甜点识别诊断工具。SHAP优化的机器学习模型将渗透率预测精度提高了40%,解决了未取心层段的关键挑战。地质力学集成进一步增强了工作流,捕捉了影响裂缝扩展和井性能的季节性应力变化(高达15%)。现场验证确认了该方法的实际适用性,优化井的初始产量提高了2.1倍,非生产钻井时间减少了28%。该研究通过弥合岩石物理、成岩和地质力学分析之间的差距,建立了一种变革性的储层表征方法。在相识别、渗透率预测和操作效率方面展示的改进强调了集成工作流在复杂储层中的价值。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号