编辑推荐:
为解决实验测量燃料关键属性耗时 costly 等问题,研究人员利用超 2200 份汽油样本的 DHA 数据,开发 SuperLearner 集成模型预测密度、蒸气压等属性。模型 MAE 表现佳,为燃料设计等提供高效精准方法。
在能源需求日益增长且可持续发展要求迫切的当下,燃料性能的精准预测成为燃料工程领域的关键挑战。传统依赖 ASTM 标准的实验测量方法,虽能确保燃料属性测量的 accuracy、reproducibility 和 comparability,但存在需大量样本、耗时长、成本高且易受变量影响等局限。此外,传统的经验关联方法在面对复杂燃料混合物和新型化学成分时,适用性受限,外推时可能缺乏准确性。因此,开发一种高效、精准且能适应复杂燃料体系的预测方法迫在眉睫。
沙特阿美研发中心的研究人员开展了相关研究,旨在利用机器学习(ML)技术,开发能准确估算汽油混合物密度、蒸气压、蒸馏曲线以及研究辛烷值(RON)和马达辛烷值(MON)的模型,以助力可持续燃料的设计。该研究成果发表在《Fuel》上。
研究人员采用了以下主要关键技术方法:首先,收集全球超过 2200 个汽油样本的详细烃分析(DHA)数据,这些数据涵盖了多种商业燃料(包括常规和优质燃料类型)。然后,将 DHA 中的组分名称转换为简化分子输入线输入系统(SMILES)表示,这是一种分子公式语言。接着,利用 PubChemPy 包在 Python 环境中将这些 SMILES 字符串进一步转化为分子描述符,这些描述符能够捕捉分子的各种物理化学性质。之后,将分子描述符按 DHA 组分的相应体积分数加权后输入模型。模型采用 SuperLearner 集成方法,从 40 个基础学习器中通过数据驱动选择过程筛选出性能最佳的前 5 个学习器进行组合。
混合物密度
通过对测试数据集的预测,模型在混合物密度预测方面表现出色。从相关数据可知,模型实现了 0.001 g/cc 的平均绝对误差(MAE)、0.002 g/cc 的均方根误差(RMSE)以及 0.969 的 R2 值。这些性能指标表明,该模型在预测未知数据的混合物密度时具有较高的准确性。
蒸气压
模型在蒸气压预测上也取得了良好效果,其 MAE 为 0.371 psi,这一结果显示出模型对蒸气压这一关键参数的预测具有一定的可靠性,能够为燃料的挥发性和蒸发特性评估提供有力支持。
蒸馏曲线
对于蒸馏曲线的预测,模型的 MAE 在 1.110 至 2.764°C 之间。值得注意的是,该模型对蒸馏曲线的预测误差在既定的再现性容差范围内,说明其能够较为准确地反映不同沸腾馏分的温度分布和回收率等蒸馏特性。
辛烷值(RON 和 MON)
在辛烷值预测方面,模型对研究辛烷值(RON)和马达辛烷值(MON)的 MAE 分别为 0.635 和 0.922,同样处于既定的再现性容差范围内,表明模型在预测燃料抗爆震能力的关键指标上具有较高的可信度。
研究结论表明,所开发的 SuperLearner 集成模型利用按混合物中各组分体积分数加权的分子描述符作为输入特征,在预测混合物密度、蒸气压、蒸馏曲线各点、研究辛烷值(RON)和马达辛烷值(MON)方面表现良好。该模型的成功开发具有重要意义:它为燃料属性的预测提供了一种高效、精准的新方法,弥补了传统实验测量和经验关联方法的不足。通过该模型,能够在无需进行大量繁琐实验的情况下,准确预测燃料的关键属性,这对于优化燃料成分、确保发动机兼容性以及满足严格的法规要求具有重要的实际应用价值。此外,研究中引入的结合分子描述符和体积分数构建输入特征的新方法,以及 SuperLearner 集成模型的应用,为复杂真实燃料的属性预测提供了新的思路和框架,有望推动基于机器学习的燃料属性预测技术的发展,特别是在复杂的现实燃料场景中的应用。同时,研究中纳入的来自文献来源的替代燃料附加数据集,增强了 RON 和 MON 模型的通用性,为基于所需 RON 和 MON 目标的替代燃料配方制定提供了框架,有助于进一步拓展燃料设计的可能性,推动可持续燃料的开发与应用。