从生物质废弃物到CO2捕集:基于多保真度机器学习的活性炭高通量筛选新策略

《npj Computational Materials》:From biomass waste to CO2 capture: a multi-fidelity machine learning workflow for high-throughput screening of activated carbons

【字体: 时间:2025年11月25日 来源:npj Computational Materials 11.9

编辑推荐:

  本研究针对优化活性炭(ACs)用于CO2捕集过程中实验资源密集、高质量数据稀缺的难题,开发了一种结合多头部一维卷积神经网络(MH1DCNN)与多保真度贝叶斯优化(MFBO)的机器学习工作流。该研究利用841个文献样本作为高保真数据,MH1DCNN预测作为低保真数据,通过MFBO融合多源信息构建概率代理模型,实现了高效优化。结果表明,该方法将高保真评估需求降低了75%以上,仅需13次高保真评估即可识别出顶级性能的活性炭(CO2吸附量达13.16 mmol/g),为可持续材料发现和未来自主实验室的开发提供了可扩展、数据驱动的加速策略。

  
随着大气中二氧化碳(CO2)浓度持续攀升,应对气候危机已成为全球紧迫议题。碳捕集、利用与封存(CCUS)技术被视为减缓CO2排放挑战的有效策略。其中,多孔固体吸附剂,特别是源自可持续废弃资源的活性炭(ACs),因其高比表面积、可调的孔隙结构和表面化学性质,成为一种成本效益高且环境友好的碳捕集材料。然而,优化活性炭以实现最佳的CO2吸附性能,往往受限于复杂、资源密集的实验流程以及高质量数据的匮乏。传统的试错法不仅耗时费力,也难以系统性地探索广阔的材料设计空间。因此,开发高效、数据驱动的方法来加速高性能多孔碳材料的发现,显得尤为重要。这项创新性的研究发表在《npj Computational Materials》上,为这一挑战提供了全新的解决方案。
为了应对上述挑战,研究人员开发了一套整合了先进机器学习与优化算法的计算框架。该研究的关键技术方法主要包括:首先,通过系统的文献调研,手动构建了一个包含841个生物质衍生、杂原子掺杂活性炭样本的数据集,每个样本包含比表面积(SBET)、孔体积(Vmicro, Vmeso, Vtotal)、氮氧含量(Ntotal, Ototal)以及吸附条件(温度T、压力P)等八个关键特征及其对应的实验测得的CO2吸附量。其次,设计并训练了一个多头部一维卷积神经网络(MH1DCNN),用于从这些特征中学习并预测CO2吸附量,该模型通过其独特的并行分支结构有效捕获了复杂的非线性关系。最后,创新性地将MH1DNN的预测作为低成本、低保真度评估,与文献中的高成本、高保真度实验数据相结合,引入多保真度贝叶斯优化(MFBO)算法。MFBO通过高斯过程(GP)代理模型融合不同保真度的信息,并利用成本敏感的采集函数智能地指导下一步应评估哪个材料以及使用哪种保真度,从而在保证精度的同时极大降低了资源消耗。
分析MH1DCNN的性能
研究人员比较了MH1DCNN与多种基线模型的性能,包括梯度提升树(GBT)、随机森林(RF)、多层感知器(MLP)和单头部一维卷积神经网络(SH1DCNN)。通过五折交叉验证,MH1DCNN展现了最优异的预测能力,其平均绝对误差(MAE)为0.484 ± 0.029 mmol/g,均方根误差(RMSE)为0.665 ± 0.053 mmol/g,决定系数(R2)达到0.861 ± 0.022,均优于其他模型。预测值与实际值的散点图显示,MH1DCNN对高吸附值区域的预测偏差最小,表明其更好的泛化能力。模型的特征重要性分析进一步揭示,在不同吸附条件下(如0.15 bar与1 bar,273.15 K与298.15 K),压力(P)和孔结构(包括微孔体积Vmicro和比表面积SBET)是影响CO2吸附量的最关键因素,其重要性远超化学组成(氮、氧含量)。这为通过调控孔隙结构而非复杂的化学修饰来提升吸附性能提供了经济有效的指导。
分析MFBO的性能
MFBO框架的核心目标是高效地识别出具有最高高保真CO2吸附量的活性炭。研究结果显示,MFBO在探索稀疏的高性能材料设计空间方面表现出色。它通过平衡不同保真度下的探索(探索不确定区域)和利用(利用已知高性能候选物),仅经过108次迭代(包括96次低保真评估和13次高保真评估)和平均76小时的运行时间,就成功找到了CO2吸附量高达13.16 mmol/g的最佳活性炭。主成分分析(PCA)可视化清晰地展示了MFBO的搜索动态:早期迭代广泛采样搜索空间(探索),而后期迭代则集中在高性能区域(利用)。低保真模拟有效地指导了搜索方向,高保真评估则用于最终验证,这种策略极大地提高了搜索效率。
评估MFBO与传统顺序搜索方法的对比
为了凸显MFBO的优越性,研究人员将其与单一保真度贝叶斯优化(SFBO,仅使用高保真数据)和随机搜索方法进行了对比。结果表明,MFBO在效率和一致性上均显著优于其他方法。随机搜索在固定的800小时预算内表现不稳定,且平均需要350.80小时才能找到顶级性能者。SFBO虽然优于随机搜索,但平均耗时仍高达492.64小时,且收敛性依赖于初始化,变异性大(标准差157.89小时)。相比之下,MFBO的平均搜索时间仅为80.17小时,标准差低至43.24小时,其资源消耗仅占完全穷举高保真搜索的2.89%,比SFBO和随机搜索降低了超过75%。这证明了MFBO通过智能地利用低保真信息来指导高保真评估,实现了资源消耗与搜索效果的最佳平衡。
研究结论与讨论
本研究成功构建了一个将多头部一维卷积神经网络(MH1DCNN)与多保真度贝叶斯优化(MFBO)相结合的集成框架,用于高性能多孔活性炭(ACs)的筛选与优化。MH1DCNN模型在预测CO2吸附量方面表现出色,能够自动捕捉物理化学特征与吸附性能之间的复杂多维关系。MFBO框架则通过巧妙地融合低保真(模型预测)和高保真(实验数据)信息,极大地加速了最优材料的发现过程,仅用少量高成本实验就实现了高效优化。
该研究的意义在于,它提出了一种可扩展、成本效益高的数据驱动策略,能够显著加速碳捕集材料的发现和优化流程。这不仅为多孔材料的高通量虚拟筛选提供了实用工具,其模块化设计也使其易于扩展到其他材料体系。尽管当前模型主要基于材料的结构和组成特征,尚未直接关联合成参数,这在一定程度上限制了其向完全自主的“设计-合成”闭环系统的发展,但本研究无疑是迈向该目标的重要一步。它展示了机器学习与优化算法在解决复杂材料科学问题中的巨大潜力,为未来自主实验室和可持续材料发现平台的建立奠定了坚实的方法学基础。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号