基于语言模型设计高CO2溶解度的生态友好型离子液体及其在脱碳技术中的应用

【字体: 时间:2025年05月23日 来源:Artificial Intelligence Chemistry

编辑推荐:

  为应对气候变化和工业级CO2捕集技术的双重挑战,研究人员利用GPT-2和SMILES-X语言模型,设计出兼具高CO2溶解度和低生态毒性的新型离子液体(ILs)。通过迭代优化和实验验证,该研究为绿色碳捕集材料开发提供了高效AI驱动方案,成果发表于《Artificial Intelligence Chemistry》。

  

论文解读

背景与挑战
全球气候危机的核心驱动力是大气CO2浓度飙升,已从工业革命前的280 ppm升至2024年的424 ppm。离子液体(ILs)因其可调控的物理化学性质,被视为碳捕集技术的潜力材料。然而,传统方法通过实验或第一性原理计算筛选ILs成本高昂,且多数研究仅关注CO2溶解度,忽视生态毒性这一工业化应用的关键瓶颈。

研究策略与创新
来自国际团队的研究人员提出了一种颠覆性方案:利用预训练语言模型GPT-2和分子表征工具SMILES-X,构建了生成-预测-验证的闭环系统。不同于传统从头训练深度学习模型,该研究通过微调GPT-2(1.24亿参数)在仅3,109个未标记IL结构数据集上,成功生成4,825个新颖且化学有效的ILs。SMILES-X模型则在小样本(CO2溶解度数据564条,生态毒性数据110条)上实现高精度预测(R2>0.67)。

关键技术方法
研究采用三重技术路线:(1) GPT-2生成IL的SMILES(简化分子线性输入系统)序列;(2) SMILES-X预测CO2溶解度和EC50(半最大效应浓度)毒性值;(3) 通过COSMO-RS(真实溶剂类导体筛选模型)和DFT(密度泛函理论)验证物化性质。迭代训练中引入TOPSIS(理想解相似排序法)多目标优化排名,最终筛选出合成可行性评分SA<5的优选结构。

核心发现

  1. IL结构生成
    GPT-2模型测试损失仅0.12,生成IL的Tanimoto相似性指数低至0.12,UMAP(均匀流形逼近投影)显示其化学空间覆盖度远超训练集(图1)。

  2. 性质预测验证
    SMILES-X模型对CO2溶解度的MAE(平均绝对误差)为5.5 mmol/mol,毒性预测MAE 0.5 μM。COSMO-RS计算揭示:TOPSIS高分ILs具有低亨利常数(KH)和负溶解吉布斯自由能(ΔGsolv),证实其强CO2亲和力(表1)。

  3. 迭代优化局限
    经过4轮迭代后,模型开始生成氮富集的不现实结构(图3b),但S-E(溶解度-毒性)综合评分仍提升至0.28,较初始数据提高7.7%。

  4. 实验验证
    相似度87%的商业IL(1-(2-羟乙基)-3-甲基咪唑双三氟甲磺酰亚胺盐)实测CO2吸附量达70 mmol/mol(110 kPa),与预测值误差<5%(图4b)。σ-剖面分析显示阴离子通过范德华和偶极相互作用主导CO2捕获。

结论与展望
该研究证实语言模型可高效探索IL化学空间,但需警惕递归训练导致的模型坍塌。通过AI生成的ILs中,87%相似度的商业替代品已展现卓越性能,而完全新型结构需后续合成验证。未来工作将整合合成路径知识图谱,并测试ChemBERTa等专业模型性能。这项发表于《Artificial Intelligence Chemistry》的研究,为AI驱动的绿色材料设计提供了范式转换案例。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号