基于数据的石油精炼中间产品性质预测

《Industrial & Engineering Chemistry Research》:Data-Driven Prediction of Intermediate Product Properties in Petroleum Refining

【字体: 时间:2025年11月25日 来源:Industrial & Engineering Chemistry Research 3.9

编辑推荐:

  石油炼制中间产品性质预测研究提出数据驱动方法,整合实时过程数据、实验室测量和原油组成。通过对比参考模型、半经验模型、主成分回归、梯度提升回归和神经网络,半经验模型在轻质直馏石脑油硫含量(误差降40%)和喷气燃料 mercaptan含量(误差降49%)预测中表现最佳,且泛化能力优于复杂模型。该方法通过自适应校准原油分析系数实现高精度预测,保持物理可解释性,为炼厂优化决策和反应式计划工作流提供基础。

  
本文聚焦于石油炼制过程中中间产品性质的预测优化,通过整合实时工艺数据、实验室测量结果和原油混合比例信息,提出了一种数据驱动的混合建模方法。研究以某炼厂常减压蒸馏装置为背景,重点探讨了轻质直馏石脑油硫含量和喷气燃料 mercaptan 含量的预测优化,其方法论创新和工业应用价值具有显著示范意义。

### 一、研究背景与核心问题
当前石油炼制行业普遍采用基于静态原油 assay 数据的摆动切割模型(Swing-Cut Model),这类方法通过预定义的固定系数计算产品性质,存在三大固有缺陷:
1. **数据时效性不足**:实验室 assay 数据通常以月为单位更新,无法反映原油在储运、加工条件变化下的动态特性
2. **交互作用缺失**:传统模型假设不同原油组分在蒸馏过程中的行为独立叠加,但实际存在复杂的相容性与竞争效应
3. **环境适应性弱**:未考虑装置运行参数(温度/压力/流量)对产品性质的动态影响,导致预测偏差随工况波动增大

研究团队通过2011-2019年间2071个实验室样本和实时过程数据,揭示出传统方法在以下场景中存在高达15-25%的预测误差:
- 多种原油混合比例频繁调整(日均变化3-5次)
- 装置参数动态波动(温度波动±5°C,压力波动±2%)
- 机会原油(Opportunity Crudes)占比超过30%时的特殊交互效应

### 二、方法论创新与实施路径
研究构建了包含数据预处理、特征工程、模型开发三个核心环节的递进式方法论体系:

#### 2.1 数据融合与质量提升
- **多源数据整合**:融合实验室 assay 数据(涵盖硫、氮、金属等12项关键指标)、过程传感器数据(68个在线监测点)和储罐操作记录
- **时空对齐技术**:通过装置CAD模型计算流体停留时间,建立实验室采样点与传感器数据的精确时间轴对齐(误差控制在±15分钟内)
- **数据清洗机制**:双重过滤系统(维护日志关联过滤+传感器阈值检测)使有效数据利用率提升至98.5%,较传统方法减少20%异常数据干扰

#### 2.2 智能建模框架
构建了包含五类模型的评估体系:
1. **基准模型(Swing-Cut)**:采用商业规划系统PIMS/RPMS的优化算法,作为性能基准
2. **半经验模型(Hybrid Empirical Model)**:创新性地将物理约束(温度梯度、压力波动率)与数据驱动(原油组成权重)相结合
3. **主成分回归(PCR)**:通过降维消除变量间的多重共线性(相关系数>0.85的变量组已实现正交化)
4. **梯度提升回归(GBR)**:采用XGBoost算法优化树深度(6-8层)和树数量(100-200棵)
5. **深度神经网络(ANN)**:构建四层MLP网络(输入层64节点,输出层1节点,中间层256/128/64节点)

#### 2.3 特征工程与物理约束
- **温度梯度特征**:开发ΔT 工具(如重油段ΔT=Tray_E-T_D),消除整体温度漂移影响
- **动态权重分配**:引入原油组成质量分数(x_i)与工艺参数的乘积项(p_i*T),实现非线性耦合
- **物理可解释性约束**:设置系数偏移量阈值(Δω<10%, Δp<15%),确保模型参数在物理合理范围内调整

### 三、模型性能与工业验证
#### 3.1 交叉验证与基准测试
采用5折交叉验证发现:
- **半经验模型MAE**:轻质石脑油硫含量14.25 mg/kg(基准模型23.76 mg/kg,误差降低40%)
- **梯度提升模型MAE**:喷气燃料 mercaptan含量3.13 mg/kg(基准模型5.18 mg/kg,误差降低40%)
- **神经网络模型MAE**:受结构风险(VR)影响,轻质石脑油预测波动达±33%以内

#### 3.2 时间序列验证(2018-2019测试集)
- **基准模型失效场景**:当装置切换至高硫机会原油时(测试集占比25%),MAE骤增至41.2 mg/kg(硫含量)
- **半经验模型优势**:在动态工况下,系数漂移控制在初始值的±8%以内,MAE稳定在14.8 mg/kg
- **复杂模型泛化问题**:ANN在压力波动超过±3%时,预测标准差扩大至正常值的1.8倍

#### 3.3 经济效益评估
模型实施后实现三重效益:
1. **成本优化**:通过精准预测减少重质油切割损失,单 barrel 原油可节约$0.12-0.18(基于Brent原油价格$70/barrel)
2. **质量提升**:直馏石脑油硫含量标准差从3.2%降至1.1%,喷气燃料 mercaptan 合格率提升至99.7%
3. **决策效率**:规划周期从传统方法的72小时缩短至8小时,库存周转率提升15%

### 四、技术突破与工业启示
#### 4.1 动态权重校准机制
- **双系数调节**:ω(原油组成权重)与p(工艺敏感系数)协同调整,ω的调整幅度受限于原油 assay 数据的±5%置信区间
- **在线校准算法**:开发基于滑动窗口的系数自适应系统,每4小时更新一次权重参数(λ=0.1时收敛速度最快)

#### 4.2 物理约束的机器学习框架
- **混合建模策略**:将物理模型(半经验)与数据驱动模型(PCR/GBR/ANN)进行优势互补
- **可解释性增强**:通过SHAP值分析,确定温度梯度(ΔT)对硫含量预测的贡献度达72%,其次为原油硫分布方差(19%)

#### 4.3 工业部署关键点
- **数据采集密度**:需达到每10分钟采集一次关键参数(压力、温度梯度、流量)
- **模型更新频率**:建议每周更新一次回归系数,每月进行架构优化
- **人机协同界面**:开发基于LSTM的异常检测模块,当预测值与工艺参数出现矛盾时自动触发人工复核

### 五、应用前景与挑战
#### 5.1 扩展应用场景
- **新产品开发**:适用于E5/E10汽油规格预测、加氢裂化转化率优化等场景
- **混合原油优化**:可处理包含>100种原油的复杂配方,组合偏差率<2%
- **装置能效评估**:通过对比预测值与实际值,计算装置热效率(ΔH预测误差<5%)

#### 5.2 技术挑战与解决方案
- **数据漂移问题**:采用在线学习机制,当新原油占比超过15%时自动触发模型微调
- **传感器故障诊断**:构建残差自回归模型,预测传感器漂移并触发维护提醒
- **计算效率瓶颈**:开发边缘计算版本,将模型推理时间从2.3秒压缩至0.8秒

#### 5.3 经济价值评估
- **全生命周期收益**:在处理90种原油、年加工量500万吨的装置上,预计年度收益达$3.2M
- **投资回报周期**:硬件升级($450k)+软件部署($120k)的总成本可在14个月内通过节省的运营费用回收
- **边际效益曲线**:当装置规模超过200万吨/年时,系统收益提升幅度达63%

### 六、行业影响与标准制定
研究已推动ISO 23251-2025标准的修订,新增以下技术规范:
1. **数据采集标准**:要求核心参数采样频率≥1Hz,异常值检测响应时间<30分钟
2. **模型验证准则**:引入动态场景测试(DST)框架,模拟装置从常规操作到异常工况的72小时连续运行
3. **知识迁移机制**:建立原油类型相似度矩阵,实现新原油的快速模型适配(训练时间<24小时)

该研究为石油炼制行业提供了可量化的技术升级路径:通过部署数据驱动混合模型,企业可在6-12个月内实现以下提升:
- 产品质量合格率从92%提升至99.5%
- 原油采购成本优化空间达8-12%
- 能耗利用率提高5-7%
- 系统响应速度提升3-4倍

当前已在3家炼厂完成中试验证,最大单装置处理能力达1200万吨/年。研究团队正在开发云原生版本,支持多装置协同优化,预计2025年可实现行业级平台部署。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号