机器学习与神经网络在砂质沉积物粒度预测中的应用及性能比较

【字体: 时间:2025年06月19日 来源:Results in Earth Sciences

编辑推荐:

  本研究针对传统砂粒粒度分析方法耗时耗力的问题,研究人员采用机器学习(Random Forest/XGBoost)和深度学习(MLP/LSTM)算法,基于2520个砂样数据预测Udden-Wentworth尺度下的五种砂粒类型。结果显示MLP神经网络以99.6%的准确率最优,LSTM达99.34%,显著优于传统算法。该研究为沉积学分析提供了高效自动化解决方案,对油气储层评价具有重要实践意义。

  

砂质沉积物的粒度分析是沉积学研究的基础环节,传统筛分法虽能精确测定颗粒大小分布,但操作繁琐且成本高昂。随着石油勘探和地下水研究对储层物性参数要求的提高,如何快速准确地获取粒度数据成为亟待解决的问题。人工计算或专业软件处理不仅效率低下,还容易引入人为误差。在这样的背景下,人工智能技术为沉积学家提供了新思路——通过算法训练实现粒度参数的自动化预测,将科研人员从重复劳动中解放出来。

为验证这一设想,研究人员收集了科特迪瓦沉积盆地1273个河流与海滩环境的砂样数据,通过SMOTE过采样技术将样本量扩充至2520个,构建了包含五种粒度分级(VCF/CF/MF/FF/VFF)的数据集。研究采用Python平台,对比了Random Forest、XGBoost两种机器学习算法与MLP(多层感知机)、LSTM(长短期记忆网络)两种深度学习模型的性能。所有模型均通过K折交叉验证和混淆矩阵评估,训练集与验证集按7:3比例划分。

在数据准备阶段,研究团队创新性地排除了传统粒度计算必需的"平均粒径"变量,仅依靠五个筛分级别的百分比数据进行分类。通过特征重要性分析发现,中等粒度(MF)和两极粒度(VCF/VFF)对分类贡献最大,而中间粒度(CF/FF)因与其他变量强相关性(Pearson系数达-0.64)而预测价值较低。这种发现颠覆了传统粒度分析中对各筛分级别的同等重视。

3.1 机器学习算法预测结果
Random Forest在5000棵决策树规模下达到99.07%准确率,但对粗砂存在3.2%误判为中等砂的情况;XGBoost整体准确率98.81%,其独特优势在于粗砂分类的100%精确度。两种算法对极细砂和极粗砂均实现完美分类,验证了极端粒度样本的易辨识性。

3.2 深度学习算法突破
MLP以99.6%的准确率成为最佳模型,仅对1.92%的粗砂样本存在误判。LSTM虽准确率稍低(99.34%),但表现出独特的"粒度上移"现象——误判样本多被归类为更大粒径。这种系统性偏差与机器学习模型的"粒度下移"趋势形成鲜明对比,暗示不同算法对粒度过渡带的解释差异。

4.讨论
研究揭示了粒度分类中的"边缘效应":处于分类标准边界附近的中间粒度(粗砂/中砂/细砂)更易误判,而两极粒度(极粗砂/极细砂)始终能被准确识别。从储层评价角度看,将粗砂低估为中砂(孔隙度预测偏低)比高估为极粗砂更有利,因为后续修正可提升经济收益。研究还发现,现有算法对粗砂的误判率(0.64-4.49%)已低于传统粒度分析的操作误差范围(约5%)。

这项发表于《Results in Earth Sciences》的研究标志着沉积学分析方法的重大革新。通过对比四种算法性能,不仅证实了神经网络在粒度预测中的优势,更建立了适用于不同应用场景的选择标准:当追求绝对精度时首选MLP,而需要避免孔隙度高估时LSTM更具优势。该成果为油气储层快速评价提供了可靠的计算范式,其采用的SMOTE样本平衡策略和特征重要性分析方法,也为其他地质学领域的机器学习应用提供了重要参考。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号