基于可解释机器学习的低温天然气处理系统中CO2沉积温度预测框架研究

《Journal of CO2 Utilization》:Explainable machine learning frameworks for predicting CO 2 deposition conditions in cryogenic natural gas processing systems

【字体: 时间:2025年10月19日 来源:Journal of CO2 Utilization 8.4

编辑推荐:

  本研究针对低温天然气处理中二氧化碳沉积温度(DTCD)预测难题,开发了支持向量机(SVM)、人工神经网络(ANN)、径向基函数神经网络(RBFNN)和基因表达式编程(GEP)四种可解释机器学习框架。研究基于430个实验数据点构建模型,ANN模型表现最优(测试MAPE=0.60%),GEP模型推导出透明关联式。SHAP分析确认CO2浓度和系统压力为关键变量,为低温CO2捕获系统设计提供了可靠替代方案。

  
随着全球能源需求的持续增长和气候变化问题的日益严峻,天然气作为一种相对清洁的化石燃料,在能源转型过程中扮演着重要角色。然而,天然气燃烧仍会释放大量二氧化碳,这对长期环境可持续性构成了严峻挑战。碳捕集与封存(CCS)技术因此成为应对这一挑战的关键手段,其中低温碳捕集(CCC)技术因其独特优势而备受关注。
与传统碳捕集技术相比,低温碳捕集技术在再生循环过程中能显著降低能耗,同时避免了化学溶剂的使用,从而减少了腐蚀风险。从生态角度看,低温碳捕集能够以高纯度分离CO2,使其适用于食品工业等领域。在该技术中,天然气中的CO2回收是通过在极低温度下发生的沉积过程实现的。沉积点代表了气固相之间的平衡状态,此时CO2气体直接转变为固态。因此,深入研究天然气混合物中的二氧化碳沉积温度(DTCD)对于设计高效的低温碳捕集操作至关重要。
目前,预测天然气流中DTCD的方法主要依赖于热力学状态方程(EoS),但这些模型通常适用性有限,且涉及复杂计算。尽管机器学习方法在模拟CO2捕集和天然气处理系统方面已有广泛应用,但将这些工具用于建模和优化低温碳捕集策略的研究仍然有限。由于CO2沉积对低温碳捕集过程的成功具有关键影响,采用智能系统来模拟气体混合物中的DTCD成为一种创新思路。
本研究旨在填补这一空白,通过开发先进的机器学习框架来准确预测天然气混合物中的DTCD。研究人员收集了来自7个文献来源的430个实验测量值,涵盖了广泛的压力和二元/三元天然气混合物组成。研究团队实施了三种先进的机器学习框架(ANN、SVM和RBFNN),同时建立了一个基因表达式编程(GEP)模型,该模型能够提供具有物理可解释性的闭式关联式。
研究采用的主要技术方法包括:基于430个实验测量值构建数据集,涵盖二元(CO2+CH4)和三元(CO2+CH4+C2H6和CO2+CH4+N2)天然气混合物;使用压力、CH4、CO2、C2H6和N2的摩尔分数作为输入特征;通过五折交叉验证、威廉姆斯图分析和SHAP-based敏感性分析对模型进行严格验证。
新型DTCD预测模型
研究开发了ANN、SVM、RBFNN和GEP四种模型来预测DTCD。所有模型都表现出卓越的预测精度,训练阶段的MAPE值接近零。其中,ANN模型提供了最强的整体泛化能力,测试R2达到98.87%,误差指标分别为SD=0.90%、RRMSE=0.86%和MAPE=0.60%。RBFNN和SVM模型也表现良好,MAPE分别为1.08%和1.24%。GEP模型推导出了一个透明关联式,在训练数据集上达到R2为98.66%,测试集上为98.43%,表现出强大的泛化性能。
预测框架的可靠性评估
通过小提琴图和箱形图对预测误差分布进行评估,结果显示所有模型都能产生可靠的预测,大多数绝对相对误差集中在2%以下。ANN模型表现出最佳整体性能,误差中位数约为0.38%,具有较窄的四分位距和高度对称的分布。五折交叉验证进一步证实了ANN模型的稳健性,各折的测试MAPE值紧密聚集在0.58%至0.67%之间,训练误差保持在0.33%至0.45%之间,变异较小。
不同天然气混合物的预测精度
研究评估了各机器学习工具在不同天然气混合物中预测DTCD的性能。ANN模型在所有混合物类型中都表现出最高精度,在CO2+CH4混合物中MAPE为0.73%,在CO2+CH4+C2H6混合物中为0.39%,在CO2+CH4+N2混合物中为0.47%。GEP关联式也表现出色,在不同天然气混合物中的MAPE值从0.51%到0.83%不等。
DTCD随操作参数变化的模拟
趋势分析表明,新建立的工具能够有效捕捉天然气混合物中DTCD的物理变化。研究发现在CO2+CH4混合物中,DTCD通常随压力增加而增加,同时提高CO2摩尔分数会使沉积在更高温度下发生。在天然气混合物中引入N2会对CO2沉积产生轻微的抑制作用,导致DTCD值降低。而在CO2+CH4+C2H6混合物中,C2H6的存在会略微提高在较高温度下发生CO2沉积的可能性。
异常值识别
基于ANN方法生成的威廉姆斯图显示,绝大多数数据点位于有效区域内,证明了编译的实验数据库具有高质量和一致性。在总记录中,411个样本位于可接受区域,9个被归类为高杠杆点,只有10个是真正的异常值,仅占数据集的2.33%。
敏感性分析
SHAP分析表明,CO2的摩尔分数对模型输出具有最强和最一致的影响,高CO2值会推动DTCD上升。压力是第二重要的影响因素,也对DTCD预测有正向贡献。相比之下,甲烷具有中等但可变的影响,而乙烷和氮气的影响较小,SHAP幅度较低。这些模式证实了模型捕捉了关键物理输入与DTCD之间预期的非线性关系。
与文献模型比较
与文献中报道的传统状态方程(EoS)方法相比,本研究提出的模型要么优于要么匹配其准确性。ANN和GEP模型在大多数情况下提供的MAPE值与传统EoS模型相当,变化范围从0.30%到0.70%不等。从计算效率角度看,一旦训练完成,ANN和GEP模型几乎可以即时评估DTCD,在标准CPU上每次预测所需时间少于1毫秒,而基于EoS的计算通常涉及求解平衡条件的迭代过程,可能需要更多时间。
本研究开发了四种不同的机器学习模型来预测天然气系统中的DTCD,所有模型都表现出强大的预测能力,误差范围小,在不同气体混合物和操作条件下具有良好的泛化能力。其中ANN模型实现了最高精度,五折交叉验证证实了其稳定性和稳健性。同时提出的透明且实用的GEP关联式虽然精度略低于ANN,但产生了高度可接受的结果,并提供了与已知热力学趋势一致的物理可解释方程。
SHAP-based敏感性分析确定CO2的摩尔分数和系统压力是影响DTCD的最重要特征,这与物理直觉和实验观察一致。趋势分析证实模型成功捕捉了预期的非线性热力学行为。威廉姆斯图分析显示大部分数据集落在模型的适用域内,只有少数轻微异常值。
这些模型为预测低温系统中的CO2沉积行为提供了稳健、数据驱动的框架,对天然气加工、运输和安全系统设计具有实际意义。它们为低温CO2捕集系统设计提供了可靠且可解释的替代方案,特别是需要快速、数据驱动的DTCD估计的场景中表现出明显优势。该研究为低温天然气处理领域的相平衡预测和过程优化提供了重要工具和方法学基础,对推进碳捕集技术的发展具有重要意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号