改进了用于预测更高热值的一般相关性模型：新的多项式相关性方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Fuel》：Improved general correlations for predicting higher heating values: New polynomial correlations

【字体：大中小】 时间：2026年02月07日 来源：Fuel 7.5

编辑推荐：

　　本研究提出了一种结合高阶多项式与LASSO回归的新型相关性模型，用于预测燃料的高热值。相比现有相关性和部分机器学习方法，该模型在多种燃料类别中表现出更高的准确度（R2=0.9376），尤其是适用于木材、草类、 husks和有机残留燃料，且易于复现。

迈克尔·宾斯（Michael Binns）

韩国首尔东国大学化学与生物化学工程系，地址：首尔中区Pildong-ro 1-gil 30号，邮编04620

摘要

通常使用相关性来根据近似分析或元素分析估算不同燃料的高发热值。已经为煤炭或生物质等不同类型的燃料开发了大量相关性模型。然而，适用于所有燃料的通用相关性模型却很少。最近，机器学习方法也被用于更准确地预测这些发热值。不过，与相关性模型相比，机器学习方法往往更难以复现。本研究开发了新型的高阶多项式模型，旨在弥合这一差距，在避免机器学习复杂性的同时提高预测精度。对于大量多样的燃料样本，研究发现一个包含23个参数的三次方程式能够以0.9376的R2值预测高发热值，这一结果优于现有最佳相关性模型的0.9088的R2值，也略高于最佳机器学习方法的0.9567的R2值。此外，该模型在预测木材、草、壳类物质、城市固体废物和有机残渣等燃料子类别时表现最为准确。

引言

高发热值（HHV）是指燃料燃烧过程中释放的热量[1]。这对于热化学转化过程的建模和设计（作为能量平衡的一部分）非常有用。实验上通常使用弹式量热计设备来测量高发热值[2]。Sheng和Azevedo指出，这种测量方法复杂且耗时，建议使用近似分析和元素分析来获得更简单且成本更低的结果[3]。然而，Akkaya指出，实际上进行元素分析更为繁琐且成本更高[2]。尽管这两种方法的难度有所不同，但在许多情况下仍然没有测量或报告高发热值。在这种情况下，基于近似分析或元素分析来预测高发热值的方法就显得非常必要。

近似分析可以得出灰分、挥发分和固定碳的重量百分比，而元素分析则能提供碳、氢、氧、氮和硫等元素的重量百分比。基于这些重量百分比和现有的实验数据，已经开发了许多用于预测高发热值的相关性模型[2]、[3]、[4]、[5]、[6]、[7]、[8]。例如，Milne相关性模型以及Akkaya等人的相关性模型分别基于元素分析和近似分析来预测煤炭的高发热值[2]、[7]；Parikh等人则基于近似分析开发了适用于固体燃料的相关性模型[5]。近年来，许多研究集中在预测不同类型生物质和热解生物质的高发热值上，例如Friedl等人和Nhuchhen与Afzal的相关性模型[6]、[8]。这些模型大多基于对多种表达式的实证测试并结合了一些理论原理。Channiwala和Parikh提到，一些相关性模型考虑了完全燃烧所需的氧气量这一关键因素[4]。Merckel和Heydenrych进一步发展了基于完全燃烧所需氧气量（实际上是供给燃料的氧气量与总氧气量的比值）的三阶和四阶多项式相关性模型[9]；Jiang等人也采用了类似的方法，基于还原程度来开发相关性模型[10]。可以看出，这些相关性模型通常是针对特定燃料类型开发的。不过，Channiwala和Parikh提出了一个适用于所有燃料的通用相关性模型[4]。由于其相对较高的准确性和广泛适用性，这种方法在气化研究等领域得到了广泛应用[11]、[12]。

此外，最近的研究还探索了利用机器学习工具来更精确地预测高发热值[13]、[14]、[15]、[16]、[17]、[18]、[19]、[20]、[21]。例如，这些方法包括支持向量机（SVM）[15]、[16]、[18]、[19]、[20]、人工神经网络（ANN）[13]、[14]、[18]、[19]、[21]、自适应神经模糊推理系统（ANFIS）[17]、[18]、决策树（DT）[15]、[16]、[21]、随机森林（RF）[15]、[16]、[19]、[20]。Yaka等人和Xing等人测试了多种机器学习工具，发现随机森林模型表现最佳[15]、[19]；尽管Zhu等人发现极端梯度提升（Extreme Gradient Boosting）模型的性能优于随机森林[20]；Pachauri等人表明，结合多种机器学习方法的集成模型能够获得最高精度，但会导致模型更加复杂[21]。

虽然这些机器学习方法在预测不同燃料类型的高发热值时具有较高精度，但由于方法复杂性、参数数量较多、软件依赖性以及控制模型训练的超参数设置等原因，它们往往难以复现。因此，要复现某个机器学习模型可能需要找到相关参数并重新训练模型以便在本地使用。因此，作者在论文中提供模型的源代码或程序是非常有用的。Insel等人和Yaka等人就提供了MatLab代码，使得各种方法能够较为容易地被复现，且只需具备基本的MatLab知识[13]、[15]。

与相关性模型相比，机器学习方法通常能提供更高的预测精度。但由于复现难度较大，相关性模型仍更为常用，因为它们更简单且易于复现。本研究的目的是缩小这两种方法之间的差距，开发出精度更高且形式相对简单的相关性模型。本研究采用了高阶多项式结合最小角度收缩（Least Angle Shrinkage）和选择算子（Selection Operator）的方法，即HOP:LASSO[22]，并将其应用于包含多种潜在燃料的大规模数据集，从而得到了新的通用相关性模型，实际上是对Channiwala和Parikh原始模型的改进[4]。因此，本研究的新颖之处在于开发出了比现有模型更准确的高发热值预测模型。

数据集收集、整理与筛选

数据集来自四个主要来源：Phyllis 2数据库，以及Channiwala和Parikh、Parikh等人以及Nhuchhen和Afzal的研究[4]、[5]、[8]、[23]。将这些数据源的信息整合后，形成了包含超过2000条记录的综合性数据集。需要注意的是，Phyllis 2数据库中的数据是使用相关性模型计算得出的发热值，Nhuchhen和Afzal收集的数据也是如此。

结果与讨论

该数据集涵盖了多种燃料的高发热值。基于第2.2节描述的方法，开发了新的相关性模型，并将其与表1中的现有相关性模型以及文献中的最新机器学习模型进行了比较。

结论

为了提高预测精度和便利性，提出了一种新的相关性模型，该模型在预测多种燃料的高发热值方面优于现有模型。新的三次多项式相关性模型（如公式（24）所示）优于多种机器学习方法，可以视为对现有通用相关性模型的改进，适用于估算任何燃料的高发热值。该模型在预测草、植物、有机残渣和城市固体废物等燃料的高发热值时表现最为准确。

CRediT作者贡献声明

迈克尔·宾斯（Michael Binns）：负责撰写、审稿与编辑、初稿撰写、数据可视化、模型验证、方法论设计、数据分析、概念构建。

利益冲突声明

作者声明没有已知的财务利益冲突或个人关系可能影响本文的研究结果。

致谢

感谢Min Kim协助从Phyllis2数据库中收集数据。

本研究未获得公共部门、商业机构或非营利组织的任何资助。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号