
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于岩心数据增强(CDA)的储层参数预测优化:机器学习与预训练语言模型的协同创新
【字体: 大 中 小 】 时间:2025年09月14日 来源:Marine and Petroleum Geology 3.6
编辑推荐:
本文提出了一种可靠性分析驱动的岩心数据增强(CDA)工作流,通过集成多种表格数据增强技术(如TabDDPM、TabPFN)与机器学习(ML)及预训练语言模型(PLM),有效解决了储层参数预测中因岩心数据稀缺导致的模型过拟合和泛化能力不足问题。该框架在渤海湾盆地X凹陷砂岩储层的岩性分类和物性参数预测中表现出优异性能,为小样本地球物理数据分析提供了可复现的创新路径。
Section snippets
Overview of the generation workflow
本研究旨在将岩心数据增强(CDA)与机器学习模型(ML)及预训练语言模型(PLM)相结合,建立储层参数预测工作流,主要包括以下步骤:
Data Preprocessing. 对研究区采集的测井数据和岩心实验结果(如岩性、孔隙度、渗透率)进行预处理,构建原始数据集。
CDA. 通过多样化的表格数据增强技术丰富岩心表格数据。表格数据增强方法包括……
Collection and Design of Core Data Sets
Regional Overview. 渤海湾盆地作为新生代裂谷盆地,经历多次构造运动,形成多个凹陷和隆起(图3a),是中国最大的原油生产基地。X凹陷位于渤海湾盆地西部,构造上介于太行山隆起和高阳低隆起之间(B. Chen et al., 2024),其南北边界由两条主要横向断层界定……
Application - Reservoir Parameter Prediction
在完成CDA方法的可靠性分析后,我们选择TVAE、TabDDPM、GReaT和TabPFGen作为X凹陷区块的最适用方法。这些优化模型生成的合成数据与原始岩心数据共同构成应用阶段数据集。我们利用主流ML和PLM模型的分类与回归能力,对该区块进行岩性分类和储层参数预测。
Discussion
CDA方法的可靠性已通过对岩心数据的应用得到验证,不同技术在岩性分类、孔隙度预测和渗透率预测中表现出不同程度的精度提升。然而,这些方法的数据驱动特性存在一定局限:岩心数据需达到足够规模才能有效应用某些数据增强技术(如基于概率推导模型的方法)……
Conclusion
我们提出了一种利用CDA增强储层参数预测的工作流,包括数据预处理、CDA实施、可靠性分析和储层参数预测。可靠性分析结果表明,TVAE、DeltaVAE和TabDDPM在小规模数据集上能生成高质量的合成数据;对于大规模数据生成,预训练大语言模型(GReaT和TabPFGen)展现出强大潜力。在……
生物通微信公众号
知名企业招聘