基于深度学习的数字岩石物理学分析:从通过少量样本学习进行图像分割和边缘检测,到机械性能预测

《Geoenergy Science and Engineering》:Deep-learning-based digital rock physics analysis: from image segmentation and edge detection by few-shot learning to mechanical properties prediction

【字体: 时间:2025年08月07日 来源:Geoenergy Science and Engineering 4.6

编辑推荐:

  数字岩石物理(DRP)中,基于深度学习的图像分割与边缘检测存在数据依赖性强、忽略地质先验知识等问题。本文提出EdgeSegNet,结合少样本学习与多任务协同优化:1)通过CLAHE增强图像对比度,傅里叶变换提取高频细节,构建双通道输入的共享层;2)设计交互约束模块(ICM)实现分割与边缘任务的深度协同;3)改进MMOEROCK网络,将边缘特征作为先验知识输入,同步预测岩石弹性模量。实验表明,EdgeSegNet在少样本条件下分割精度达94%,边缘检测达98%,且机械性质预测R2提升0.03,显著优于传统单任务模型。

  在数字岩物理(Digital Rock Physics, DRP)领域,研究者们正致力于通过高分辨率图像处理与数值模拟相结合的方式,精确地揭示岩石微观结构对工程和地质特性的影响。随着人工智能技术的迅速发展,DRP分析的智能化程度显著提高,但当前大多数研究仍然局限于使用分割后的图像来估计岩石的力学特性。这种做法在一定程度上存在两个潜在限制:一是基于深度学习的图像预处理准确性依赖于大规模数据集,二是地质活动相关的先验信息(如边缘特征)常常被排除在力学特性估算之外。为了解决这些问题,我们提出了一种基于少量样本的图像分割与边缘检测方法(EdgeSegNet),以及一种通过引入先验信息进行多任务学习的网络(MMOEROCK),以实现对岩石力学特性的同时预测。实验结果表明,在有限的训练数据集下,分割和边缘检测的精度分别达到了约94%和98%,这比其他常用网络表现更优。这种提升得益于三项关键的架构优化:一是利用对比度受限自适应直方图均衡(CLAHE)进行图像对比度增强,从而提高岩石微观结构的清晰度;二是通过傅里叶变换和高通滤波提取高频率空间细节,以揭示精细纹理和边缘;三是设计了一个交互约束模块(Interactive Constrained Module, ICM),通过分割与边缘流之间的信息交互与约束,促进任务间的互补性。此外,受先验信息约束的力学特性预测在R2分数上比未受约束的方法提升了0.03,这表明在力学特性预测中,考虑与地质过程相关的微观几何特征,有助于更深入地理解岩石物理机制。

数字岩物理提供了一种强有力的工具,用于从物理特性出发,对岩石的微观结构进行精准表征。高分辨率成像技术(如CT扫描和扫描电子显微镜)和数值模拟方法被广泛应用于该领域,从而在能源勘探与开发、二氧化碳和氢气的地质封存、地下水管理以及核废料处置等方面具有广泛的应用前景。然而,由于高质量标注数据的获取困难,尤其是在数据量有限的情况下,传统的深度学习方法在处理这类问题时面临诸多挑战。因此,开发一种适用于有限数据的智能方法,成为当前研究的热点。同时,图像分割与边缘检测作为DRP的两个关键步骤,对后续力学特性预测具有决定性作用。为了提升这两个步骤的准确性,本文提出了一种新的方法,该方法不仅能够减少对大规模数据集的依赖,还能够有效提取与地质活动相关的边缘特征,为后续的力学特性预测提供更丰富的信息。

在数字岩图像处理中,图像分割和边缘检测是相互关联且相辅相成的两个任务。传统的分割网络往往难以捕捉到微小孔隙或边界过渡的细节,而单独的边缘检测方法在处理复杂结构时也存在局限。因此,我们提出了一个“一源多用”的策略,旨在最大化数据的利用效率,并通过整合边缘特征,提高这两个任务的性能。该策略在将分割与边缘检测整合到单一网络中时尤为有效。分割任务通常在低分辨率或特定尺度下难以准确捕捉边缘细节,而边缘检测任务则需要对输入图像进行多尺度变换,这可能会导致边界偏移和预测精度下降。为了解决这一问题,我们设计了一个交互约束模块,该模块能够在边缘检测路径中保留原始输入分辨率,从而更精确地捕捉到边缘的空间几何关系。同时,通过引入深度监督策略,我们在网络的不同层级对分割和边缘检测结果进行监督,使得模型在训练过程中能够更有效地学习多级特征,提高其泛化能力和性能。

本文提出的EdgeSegNet网络采用了一种基于少量样本的深度学习方法,能够在数据量有限的情况下实现高质量的图像分割与边缘检测。为了克服数字岩图像中常见的低对比度和边界不清晰的问题,我们设计了一个信息增强共享层(Information-Enhancing Shared Layer, IESL),该层基于CLAHE和傅里叶变换的高频率信息提取技术,将原始图像转换为双通道输入。这种预处理策略不仅增强了图像的细节表现,还通过引入丰富的特征多样性,提升了模型在少量样本情况下的性能。此外,通过引入交互约束模块,我们实现了分割与边缘检测之间的信息交互与约束,使模型能够更有效地捕捉到边缘细节和区域特征,从而提升分割和边缘检测的准确性。

为了进一步提高模型的泛化能力,我们对输入数据进行了标准化处理,将其灰度值调整为[0, 1]区间,并通过线性拉伸以满足CLAHE的输入要求。这种预处理方法使得模型能够处理不同归一化方式的输入数据,提高了其在不同数据集中的适应性。同时,我们通过将分割与边缘检测任务的输出进行融合,使得模型能够在不同阶段进行多级监督,从而优化模型的性能。这种监督策略采用了一种逐步增加权重的方式,使得较深层的监督对最终预测贡献更大,同时减少了对浅层监督的依赖,从而在保持模型性能的同时降低了计算负担。

在力学特性预测方面,我们采用了基于多任务学习的MMOEROCK网络。该网络在处理多参数预测任务时,能够有效避免任务间的干扰,提高预测的准确性。为了进一步提升预测效果,我们将边缘特征作为先验信息引入MMOEROCK网络,通过双通道输入方式,使得模型能够同时利用二值分割图像和边缘检测图像,从而更全面地捕捉岩石的微观结构特征。实验结果表明,这种双通道输入方式显著提高了力学特性预测的准确性,特别是在涉及复杂的孔隙结构和应力集中区域时,边缘特征的引入能够有效提升模型的预测能力。

在实验验证方面,我们对多种模型进行了比较分析,包括传统的分割网络(如SegNet、ResSegNet、UNet及其改进版本)和边缘检测模型(如HED、RCF、DexiNed、BDCN和PidiNet)。通过引入CLAHE和傅里叶变换等预处理技术,以及交互约束模块和深度监督策略,EdgeSegNet在分割和边缘检测任务中均表现出优越的性能。特别是在有限数据的情况下,EdgeSegNet能够在减少训练数据量的同时保持较高的预测精度,这表明其在实际应用中具有更高的灵活性和鲁棒性。此外,通过对比不同输入方式下的力学特性预测结果,我们发现,引入边缘特征的双通道输入方式能够显著提升预测精度,尤其是在单一通道输入表现不佳的情况下,这种结合方式能够有效弥补单一输入的不足,从而提高整体预测的准确性。

本文的研究不仅为数字岩物理领域提供了一种新的图像处理方法,还展示了在实际应用中,如何通过深度学习技术有效解决数据量不足和先验信息缺失的问题。此外,EdgeSegNet网络的多任务学习框架也表明,将边缘特征作为先验信息引入到模型中,能够显著提升对岩石力学特性的预测能力。这一成果为岩石物理分析提供了新的思路,有助于更精确地理解岩石的微观结构与其宏观力学行为之间的关系,从而为地质勘探和资源开发提供更可靠的技术支持。同时,本文提出的网络结构和训练策略也为其他类似任务提供了参考,展示了深度学习在岩石物理研究中的广阔前景。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号