利用机器学习和Shapley加性解释(SHapley Additive exPlanation, SHAP)方法对页岩储层中的氢吸附行为进行评估

《International Journal of Hydrogen Energy》:An evaluation of hydrogen adsorption in shale reservoirs using machine learning and SHapley Additive exPlanation

【字体: 时间:2026年01月04日 来源:International Journal of Hydrogen Energy 8.3

编辑推荐:

  氢吸附性能评估及机器学习模型构建基于SHAP解释的页岩储氢潜力研究,通过整合291组地质参数数据,开发了决策树、随机森林、梯度提升树和人工神经网络四类预测模型,发现随机森林模型预测精度最高(测试集R2=0.9448)。SHAP敏感性分析表明储层压力(P)、比表面积(BET SSA)和黏土矿物含量(V TC)是主要影响因素,温度(T)和石英矿物含量(V QF)具有抑制作用。筛选出高压力、低温、高比表面积及孔隙体积的深层页岩储层为最佳储氢场地。

  
张伟鑫|周山东|陈瑞斌|刘大猛|严德天
中国地质大学地球资源学院,武汉,430074,中华人民共和国

摘要

为了快速量化页岩储层中的氢吸附量,以促进地下氢储存(UHS)的发展,目前迫切需要相关技术。现有的实验方法面临诸如测试条件有限以及程序耗时且成本高昂等挑战。本研究提出了一种基于机器学习与Shapley Additive exPlanation的新方法来评估页岩的氢吸附性能。我们建立了包含291个氢吸附数据集,这些数据集涵盖了八个地质参数:总有机碳含量(TOC)、硅质矿物含量(VQF)、碳酸盐矿物含量(VCM)、总粘土矿物含量(VTC)、Brunauer-Emmett-Teller比表面积(BET SSA)、孔隙体积、温度(T)和压力(P)。我们开发了四种机器学习模型——决策树(DT)、随机森林(RF)、梯度提升决策树(GBDT)和人工神经网络(ANN)来预测氢吸附量。研究结果表明,RF模型的性能最佳(训练集R2 = 0.9948,测试集R2 = 0.9448),其次是GBDT、DT和ANN。敏感性分析显示,压力(P)与页岩的氢储存潜力呈强正相关,其次是BET SSA、VTC和孔隙体积。温度(T)和VQF的增加会抑制氢的吸附。高TOC和VCM对氢吸附的影响不显著。具有高压、低温、高BET SSA、高VTC、分层结构、高孔隙体积以及适中TOC(2–6 wt%)的深部页岩储层更适合作为UHS的场所。本研究开发了一个可解释的预测模型,揭示了页岩储层中氢吸附量的控制因素,为准确快速评估页岩的氢吸附性能提供了依据,并有助于优化UHS的储存策略。

引言

向碳中和的能源转型推动了清洁和可持续能源载体的探索[1]。由于氢具有较高的单位质量能量密度和零排放燃烧特性,因此成为关键候选能源[2]。作为氢经济的重要组成部分,长期大规模的地下氢储存(UHS)对于解决氢能的间歇性问题并促进其广泛应用至关重要[3]。在枯竭的油气储层(如页岩储层和煤层储层)、含水层和盐穴中进行的UHS项目因其成本效益和可行性而受到全球广泛关注[4]。
页岩和煤中的吸附作用将氢储存在多孔的非传统储层中[3]。页岩储层由于其广泛的分布、发达的纳米孔结构以及在天然气(甲烷)储存中的成功应用证明了其出色的气体储存能力,因此展现出独特的氢储存潜力[5]。页岩储层具有独特的地质结构、优良的储层质量以及完善的地下和地面基础设施,使其成为理想的氢储存地点[6]。尽管人们对地下氢储存的兴趣日益增加,但关于页岩氢吸附的研究仍处于初级阶段。传统的实验研究为了解页岩中的氢吸附行为提供了基础性见解[7]。页岩储层中的氢吸附受到多种因素的复杂相互作用的影响,包括有机物含量、矿物含量、孔结构参数(孔隙体积和比表面积)以及储层条件(压力和温度)[3,8,9]。传统的实验方法通常耗时且成本高昂,且无法捕捉控制因素与吸附能力之间的非线性关系[10]。学者们基于甲烷(CH4)、二氧化碳(CO2)以及页岩中多种成分的吸附-解吸特性提出了许多预测吸附行为的模型[11]。现有研究主要集中在有限条件下的氢吸附等温线的实验表征上[8]。针对页岩储层中氢吸附行为的预测模型仍然不完善。
近年来,机器学习已成为解决地球科学中复杂问题的有效方法[12],[13]。机器学习能够处理高维数据,实现目标变量的高精度预测,并捕捉非线性关联[14],[15]。然而,机器学习模型的“黑箱”特性阻碍了对其预测结果的解释,使得难以获得实用的氢储存指导。缺乏可解释性限制了机器学习模型在指导页岩储层评估和优化氢储存策略方面的实际应用。为了解决这一问题,可解释的人工智能技术受到了关注[16]。基于博弈论的Shapley Additive exPlanation(SHAP)方法尤为突出[17]。SHAP能够量化每个输入特征对预测结果的贡献,从而实现对机器学习模型的透明和一致的解释[18]。SHAP敏感性分析架起了基于机器学习的数据驱动预测与机制理解之间的桥梁[19]。机器学习模型已成功应用于预测页岩中的CH4和CO2吸附,证明了它们克服传统方法缺点的潜力[20,21]。尽管有一些尝试利用机器学习来预测氢吸附或探索此类模型的可解释性,但尚未完全理解页岩性质和储层条件如何共同影响氢吸附。
本研究旨在通过结合机器学习与SHAP方法来评估页岩储层中的氢吸附性能,使用了一个包含页岩特征和储层条件参数的综合性数据集。研究内容包括:(1)基于四种机器学习方法(决策树(DT)、随机森林(RF)、梯度提升决策树(GBDT)和人工神经网络(ANN)建立并比较页岩中的氢吸附量预测模型;(2)进行SHAP敏感性分析,以确定影响氢吸附的关键因素并量化八个地质参数的相对重要性;(3)从机制层面(热力学相互作用、矿物学控制以及孔隙尺度吸附)研究氢与页岩的相互作用,以指导最佳页岩储层的评估和选择。研究的创新点在于:(i)构建用于高精度预测页岩储层中氢吸附量的机器学习模型;(ii)揭示影响页岩储层中氢吸附量的关键地质参数。通过结合预测能力和可解释性,本研究为页岩储层中的氢储存提供了新的视角,并有助于优化其储存条件。

数据收集

图1展示了使用多种地质参数通过机器学习模型预测氢吸附量的构建和评估工作流程。工作流程包括数据收集、数据预处理、模型训练、模型评估等。研究的重点在于数据收集和预处理,以及模型训练、模型评估和敏感性分析。
目前可用的高质量实验数据

基于机器学习算法的模型

本研究基于四种机器学习算法来开发页岩储层中氢吸附量的准确预测模型。选择这些算法主要是基于它们在先前研究中的适用性、适应实验数据的能力以及进行准确预测的能力。这四种机器学习算法在处理复杂结构数据和预测回归/分类问题方面表现良好。

超参数优化

超参数调优基于交叉验证和网格搜索进行。超参数的具体设置见表3。Min samples split是指分割内部节点所需的最小样本数量[40];Min samples leaf是指形成叶节点所需的最小样本数量;Max depth表示从根节点到叶节点的最大路径长度。随着min samples split和min samples leaf值的增加,训练集和验证集的平均绝对误差

模型最优选择

通过构建四个机器学习模型来预测页岩储层中的氢吸附量。根据三种误差指标R2、RMSE和SMAPE对预测结果进行分析,并对模型进行综合比较和选择。
DT模型在训练数据上表现优异,但在测试数据上的表现明显较差(R2显著较低,RMSE和SMAPE显著较高)。造成这一结果的一个可能原因是

结论

本研究利用机器学习和SHAP方法评估了页岩储层的氢吸附性能。通过关注储层条件和页岩特性,构建了一个高精度的氢吸附量预测模型,并揭示了氢吸附的控制因素。结论如下:
  • (1)
    利用机器学习方法建立了页岩氢吸附量的预测模型。输入参数包括
  • CRediT作者贡献声明

    张伟鑫:撰写——初稿撰写、调查、数据整理。周山东:撰写——审稿与编辑、监督、资金获取、正式分析。陈瑞斌:验证、方法论研究、调查。刘大猛:监督、资源协调。严德天:监督、调查。

    利益冲突声明

    作者声明没有已知的财务利益冲突或个人关系可能影响本文所述的工作。

    致谢

    本研究得到了CNPC创新基金(2024DQ02-0110)和中央高校的基本研究基金(中国地质大学(武汉)(编号2021085和2023006)的支持。我们非常感谢助理编辑Ashish Bhatnagar博士和匿名审稿人提出的宝贵意见和建议,这些意见有助于提高论文的质量。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普
    • 急聘职位
    • 高薪职位

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号