自组织映射在岩石物理学应用中的跨模态表示学习

《Geoenergy Science and Engineering》:Self-Organizing Maps for cross-modal representation learning in petrophysics applications

【字体: 时间:2025年11月19日 来源:Geoenergy Science and Engineering 4.6

编辑推荐:

  从高分辨率声波测井图像生成七种基本测井曲线的跨模态学习框架,结合自组织映射与变分自编码器,实现多输出回归与数据缺失填补。

  石油物理测井数据在油气行业的储层表征和管理中扮演着至关重要的角色。这些数据种类繁多,其获取成本、复杂程度和信息含量差异显著,从相对便宜的基础测井数据到高分辨率的声波井壁图像测井数据。这种数据多样性带来了工程上的挑战,尤其是在整合不同数据类型以及在数据稀疏或缺失的情况下生成全面的井信息。如何从这些昂贵获取的数据中提取最大价值,是行业内的一个重要需求。本文探讨了跨模态学习在石油物理数据中的应用潜力,从生成的角度出发,利用无监督表示学习方法。跨模态表示学习旨在整合多种数据模态,探索它们之间的相互关系,并揭示跨生成的可能性。为了突出无监督模型在该领域的应用能力,我们提出了一种全新的、完全无监督的框架,该框架基于对经典自组织映射(SOM)应用的理论修改,并结合了深度卷积变分自编码器(CVAE)的表示学习能力。SOM-CVAE框架能够学习跨模态表示,形成拓扑结构一致的地图,从而在不同数据域之间实现双向的预测与生成能力。我们应用该框架解决了一个在石油物理领域尚未被充分探索的问题:从高分辨率声波井壁图像测井数据中预测完整的七种基础石油物理测井曲线。这一任务是工程上的一个显著挑战,因为它涉及从图像中进行多输出回归,这在机器学习领域本身就是一个复杂的问题。鉴于该应用的新颖性,我们还调整了已有的监督深度卷积模型(如DenseNet和SimpleNet),以建立一个可靠的性能评估基准。所提出的框架在这一具有挑战性的跨模态学习任务中取得了令人信服的结果,其性能不仅与复杂的监督深度学习模型相当,甚至在某些方面超过了它们。该框架的通用性为类似图像到曲线的预测应用提供了乐观的前景,同时还能带来诸如缺失数据插补等附加优势。

石油物理测井数据(Tiab和Donaldson,2016)是在钻井过程中获取的关键地下信息,对于油气行业具有重要价值。这些测井数据在储层管理的各个阶段都发挥着重要作用,从实时钻井完成期间的决策(Trevizan和Menezes de Jesus,2023;Orban等,2021)到计算模型的优化(Zhao等,2025)。此外,石油物理数据还支持新兴的地质能源领域,包括地热能(Nath等,2024)、氢气生成与储存(Salahshoor和Afzal,2022)以及地质碳捕集与封存(CCS)(Izadpanahi等,2025;Garcia等,2025)。基础测井数据通常包括岩石的自然放射性、电阻率、孔隙度和流体饱和度等属性,而特殊测井则提供更为复杂的岩石信息,例如声波井壁图像测井数据(Zhao等,2024),其记录与岩石的声阻抗有关,通常以图像形式呈现。声波井壁图像测井数据因其高分辨率而受到越来越多的关注,这种特性使得人工智能技术在该领域的应用变得愈发重要,使石油物理解释者能够从现有数据中提取更多有价值的信息(Dramsch,2020)。除了高分辨率的特点,声波井壁图像测井数据的获取原理也基于井壁与井内流体之间的声阻抗对比。这种对比与岩石密度密切相关,而岩石密度是衡量储层质量的基本且关键的石油物理属性。近期的技术文献已明确指出,钻井过程中获取的声波数据与生产阶段的流体流动之间存在良好的对应关系(Menezes de Jesus等,2016)。

声波井壁图像测井数据的主要应用集中在识别和评估地质结构,如裂缝(Petrik等,2023)、溶洞(Deng等,2021)或具有地质力学性质的特征,如井壁崩落(Heydari Gholanlo和Nikkhah,2023)。然而,对于从这种高密度数据源中推导出其他类型的井信息,如与物理原理相关的开孔标准测井数据(如密度和中子测井)或与之不直接相关的测井数据(如伽马射线和电阻率测井),仍有许多未被充分研究的潜力。因此,声波井壁数据的生成能力可以为行业带来巨大的价值。本文的核心前提在于,从生成的角度出发,探索石油物理数据的跨模态学习潜力。通过利用无监督表示学习方法,工程师和石油物理学家能够从不同阶段获取的昂贵数据中提取更多信息,同时也支持行业中常规的数据生成需求。

在本文中,我们提出了一种全新的、完全无监督的框架,基于自组织映射(SOM)(Kohonen,2001;Kohonen,1990)来实现不同数据域之间的数据生成。SOM是一种经典的无监督算法,它学习将输入空间χ映射到离散的输出空间A,其中A代表SOM单元的几何格子。SOM的显著特征在于它能够保留输入空间χ中的拓扑关系,并在输出空间A中再现这些关系。这种能力源于SOM训练过程中竞争-合作的策略,其中获胜单元i*(即最接近输入的单元)能够有效地捕捉数据的结构特性。虽然SOM在石油工业中的应用并不新鲜,但近年来其使用频率显著增加。大多数近期的SOM应用主要集中在它的经典功能上,例如用于高级聚类(Jimenez Soto等,2023;Zhang等,2022;Ali Akbar等,2022;Maas等,2022)或用于降维和数据可视化(Li和Aguilera,2018)。然而,在本文中,我们将SOM置于跨模态学习方法的核心,展示了其在解决多个数据源整合这一复杂问题中的潜在价值。

我们的无监督跨模态学习框架被应用于从声波井壁图像测井数据中预测七种基础石油物理测井曲线。这是首次尝试成功完成这一任务的工作。从高密度数据源(如声波图像测井数据)中预测基础低密度数据(基础测井曲线)可以被归类为“数据理解”任务(Tan等,2024)。据我们所知,预测从声波图像测井数据到常规开孔测井曲线的问题在石油物理领域尚未被充分研究。有几个原因可以解释这一点。首先,基础测井数据相对便宜,大多数井都配备了这些数据。其次,这种学习过程并不简单,因为它需要从图像中进行多输出回归,这在机器学习领域本身就是一个具有挑战性的问题。我们的框架能够在完全无监督的条件下完成这一任务,同时为石油物理领域带来以下贡献:首先,它展示了如何从声波图像中提取易于理解和解释的特征(基础测井数据);其次,它允许对缺失值或甚至整个缺失曲线进行插补;第三,它能够以与声波图像相同的垂直深度分辨率重建基础测井曲线;第四,它为从基础测井数据反向生成声波图像提供了基础;最后,所提出的无监督且拓扑保持的联合映射方法还允许使用经典的SOM特征,如聚类和数据可视化,帮助专家揭示不同测井类型之间可能存在的意外关系,并加深对高信息量图像测井数据的理解。

此外,该框架可以扩展到其他图像到曲线的预测任务,具有广泛的应用前景。例如,在油气行业之外,它还可以应用于生物医学工程和遥感等领域。为了建立一个评估我们框架结果的基础,并为实验任务的技术复杂性提供背景,我们采用了两种已有的深度卷积模型,DenseNet(Zhang等,2024;Huang等,2017)和SimpleNet(Hasanpour等,2023),这些模型最初是为了解决计算机视觉问题而设计的。通过与这些模型的对比,我们能够更全面地理解所提出框架的优势和局限性。

在本文的后续部分,我们将详细阐述我们的方法。随后,我们将介绍具体的数据集和实验设计。最后,我们将对实验结果进行分析,并总结本研究的主要成就,同时指出未来可能的研究方向。本文的结构如下:首先,我们将介绍所提出的方法;其次,我们将描述数据集的构成和实验设置;接着,我们将分析实验结果;最后,我们将总结研究发现,并展望未来的发展。我们希望本文能够为跨模态学习在石油物理数据中的应用提供新的思路,并为行业内的数据整合和生成任务提供有效的解决方案。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号