编辑推荐:
针对农林废弃物生物炭性质多样、缺乏通用多性质预测模型的问题,研究人员评估 6 种 ML 模型预测生物炭产量(BY)、碳含量(C)等 8 项性质。发现 CatBoost 性能最佳(R2 0.76-0.95),SHAP 分析确定关键影响因素,开发了可视化预测工具,助力精准生产。
在全球工业化与人口增长的双重压力下,每年约产生 10 亿吨农林废弃物,其不当处理引发污染与温室气体排放等环境难题。生物炭作为农林废弃物热解的富碳产物,在固碳、土壤改良和可再生能源领域潜力巨大,但其性质受原料和热解条件影响显著,导致不同应用场景下难以通过传统实验方法高效制备目标性质的生物炭。现有机器学习(ML)模型多聚焦单一性质预测,缺乏能同时评估生物炭多项性质的通用模型,这极大限制了其工业化应用。
为填补这一研究空白,温州大学的研究人员开展了相关研究。他们收集 43 种农林废弃物的 288 个热解数据集,系统评估了 CatBoost、LightGBM、NGBoost、XGBoost、RandomForest 和 AdaBoost 六种 ML 模型对生物炭产量(BY)、碳含量(C)、固定碳含量(FC)、灰分含量、能量产率(EY)、高位热值(HHV)、pH 和阳离子交换容量(CEC)共 8 项性质的预测能力,并借助 SHAP 分析揭示关键影响因素,最终开发出模块化可视化预测工具。该研究成果发表在《Biomass and Bioenergy》。
研究主要采用的技术方法包括:从已发表文献中筛选可靠数据集,涵盖农林生物质组成(如纤维素、半纤维素、木质素含量)和热解条件(如温度)等输入特征,以及生物炭各项性质的输出特征;运用皮尔逊相关系数(PCC)分析输入与输出特征的相关性;通过六种 ML 模型构建预测模型,并以 R2 值评估模型性能;利用 SHAP 值分析各特征对生物炭性质的影响权重。
数据收集与模型评估
研究从 peer-reviewed 文献中严格筛选典型农林废弃物样本及多样热解条件数据,确保数据集的可靠性与多样性。通过对比六种 ML 模型,发现 CatBoost 性能最优,其预测各性质的 R2 值在 0.76(如 CEC)至 0.95(如 BY、C)之间,显著优于其他模型,展现出对多性质预测的强泛化能力。
关键影响因素分析
结合 PCC 与 SHAP 分析,热解温度被确定为影响 BY、C 含量和 pH 的关键因素:高温促进挥发性物质释放,增加灰分含量与 pH,降低 BY 但提升 C 的稳定性;低温则保留更多含氧官能团,提高 CEC 但降低 HHV。原料组成方面,纤维素和木质素含量对 CEC 和 FC 影响显著:高纤维素原料在低温下分解产生多孔结构,增强 CEC;高木质素原料需高温热解形成致密碳基质,提升 FC 稳定性。
可视化工具开发
基于 CatBoost 模型,研究团队开发了可动态调整热解参数的模块化可视化预测工具。用户通过输入原料类型(如富含纤维素的稻草或木质素的木屑)和目标应用场景(如土壤改良需高 pH 和 CEC,能源利用需高 HHV 和 EY),工具可精准推荐热解条件,助力大规模生产特定性质的生物炭,显著提升生产效率与针对性。
研究结论与意义
本研究首次构建了能同时预测生物炭多项关键性质的通用 ML 模型,证实 CatBoost 在多性质预测中的优越性,并通过 SHAP 分析明确了热解温度与原料组成的关键作用。开发的可视化工具为农林废弃物的高效转化提供了智能化解决方案,有望推动生物炭在土壤改良、固碳和可再生能源领域的工业化应用,助力碳中和目标与循环经济发展。研究结果为生物炭生产的精准调控提供了理论依据与技术支撑,展现了 ML 在复杂生物转化过程中的强大分析能力。