基于特征工程与CatBoost算法的生物油含氮组分预测与调控机制研究
《Bioresource Technology》:Integrating multiple feature engineering methods with CatBoost algorithm for the prediction and interpretation of nitrogenous components in bio-oil from biomass pyrolysis
【字体:
大
中
小
】
时间:2025年10月18日
来源:Bioresource Technology 9
编辑推荐:
本文创新性地将PLS、PCC等特征工程方法与CatBoost算法相结合,构建了生物油含氮组分(NCs)的精准预测模型(R2>0.94),揭示了生物质氮含量对NCs形成的关键作用,为定向调控生物油品质提供了新范式。
共从100篇已发表研究论文中收集528个数据点构建数据集,数据来源详见补充材料。大部分数据直接取自文献正文、表格及补充材料中的实验报告,对于少量未直接列出的数据,使用WebPlotDigitizer工具(https://automeris.io )从图表中提取所需数据。
图1(a)展示了变量的可视化描述。生物质中C、H、O、N、S含量范围分别为13.82–82.41 wt%、1.87–10.8 wt%、2.63–73.68 wt%、0.05–34.11 wt%和0–10.3 wt%。水分、固定碳、挥发分和灰分含量分布范围分别为0–14.8 wt%、0.25–76.27 wt%、68.16–97.93 wt%和0.48–68.89 wt%。组分值的变异应归因于生物质种类的多样性。
本研究提出了一种结合特征工程与CatBoost的新框架,用于预测生物质热解生物油中NCs的分布。通过比较模型预测精度,为每个输出选择了最优的特征工程方法。变量间的线性关系对模型预测影响最大。氮含量是对所有输出均具有主导重要性且呈正相关的共同特征。最终,结果通过实验验证,证实了该框架的有效性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号