机器学习结合空间交互效应评估油田土壤生态风险:以华北油田为例

【字体: 时间:2025年06月22日 来源:Ecotoxicology and Environmental Safety 6.2

编辑推荐:

  推荐:针对油田土壤中总石油烃(TPHs)和有毒元素污染问题,研究人员结合机器学习(ML)与遥感(RS)技术,构建梯度提升机(GBM)模型预测污染物浓度(R2=0.6270–0.8678),并通过空间双变量LISA分析揭示污染驱动机制,为油田土壤风险精准管控提供技术支撑。

  

随着石油开采活动的加剧,油田周边土壤中总石油烃(TPHs)和有毒元素污染已成为严峻的环境问题。传统克里金插值和蒙特卡罗模拟等方法在预测污染物空间分布时存在平滑效应强、数据需求高等局限性。华北油田作为中国历史悠久的产油区,其土壤污染具有来源复杂、空间异质性显著的特点,亟需开发高效精准的预测模型以支持生态风险管理。

中国环境科学研究院的研究团队创新性地将机器学习与遥感技术结合,通过解析高分二号卫星影像获取植被覆盖度(FVC)、土壤类型等18项环境因子,构建了H2O AutoML框架下的梯度提升机(GBM)模型。该研究采集207个土壤样本,预测了1252口油井周边TPHs及As、Pb、Ni、Cd、Hg的浓度分布,并采用潜在生态风险指数(RI)和双变量局部空间关联指标(bivariate LISA)进行风险评估。论文发表于《Ecotoxicology and Environmental Safety》。

关键技术包括:(1)基于RS提取产能设施密度指数(CFDI)和开采占用比指数(EORI);(2)采用10折交叉验证训练GBM、堆叠集成(SE)等模型;(3)通过SHAP值解析变量贡献度;(4)构建5000m×5000m网格进行空间自相关分析。

研究结果显示:

  1. 污染物统计特征:Cd和Pb超标率最高(62.80%和59.42%),TPHs变异系数(CV)达0.30以上,呈现强空间异质性。
  2. 模型性能:GBM预测效果最优,TPHs、As、Pb的R2分别为0.7730、0.8614、0.8678,Hg预测精度较低(R2=0.6270)可能与低浓度检测误差有关。
  3. 驱动因素:开采活动(EORI)、景观破碎度(LAND)和盐度指数(SDI)是关键变量,高EORI值使TPHs预测值提升47%,而高CEC(阳离子交换容量)抑制污染物迁移。
  4. 生态风险:22.73%区域为清洁区,18.18%存在TPHs与有毒元素复合污染,Hg和Cd构成主要生态风险(79.73%区域达中度风险)。
  5. 空间格局:Moran's I指数显示TPHs(0.4504)和PERI(0.4382)呈显著空间聚集,任丘-河间一带形成高-高聚集区(HH)。

讨论部分指出:

  1. 污染来源:聚类分析表明TPHs独立成簇,而Hg-Cd-As同源,可能与石化副产品有关;Pb-Ni则受工业活动影响。
  2. 区域差异:任丘因开采强度大成为TPHs热点,雄安新区因产业调整以有毒元素污染为主。
  3. 方法创新:相比传统插值法,GBM模型能捕捉非线性关系,但需针对不同油田调整植被指数(如NDVI)等区域特异性参数。

该研究首次将空间交互效应分析与AutoML结合,为油田土壤风险分级管控提供了可推广的技术框架。未来可整合人口密度等社会参数进一步优化模型,推动石油工业与生态环境的协同发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号