大语言模型与物理模型协同进化:推动先进电池研究的创新力量

【字体: 时间:2025年04月24日 来源:Cell Reports Physical Science 7.9

编辑推荐:

  本文聚焦大语言模型(LLMs)与物理模型的协同进化在先进电池研究中的应用。通过将物理模型嵌入 LLMs,构建了可实时交互的系统,能处理电池研究多环节问题,提升研究效率,为实现通用人工智能助力,值得相关领域学者一读。

  

研究背景


大语言模型(LLMs)的发展为科研带来新契机,其在多领域广泛应用,如自然语言处理、医学、化学、能源存储和转换材料等。以 Transformer 为基础的模型因能实现模态交互且易于预训练,成为常用类型,OpenAI 的 GPT - 4 更是其中先进代表,具备处理多模态信息的能力。

借助 LLMs,自主大规模科学信息精炼技术兴起,可构建特定研究领域数据集,形成潜在专家咨询系统,推动化学研究自动化,诸多研究团队已取得成果,像 Ceder 团队的无机粉末合成平台、Gabe 团队的 Coscientist 系统、Jensen 团队的分子自动合成研究等。

然而,LLMs 在科研应用中存在局限。其逻辑处理能力有限,在处理实际化学过程中的定量关系时面临困难,虽可通过提示工程技术改善,但输出结果缺乏物理内涵,难以满足科研对准确性和可靠性的要求。

研究内容


针对 LLMs 的不足,研究提出一种让 LLMs 与物理模型协同进化的范式。利用基于 GPT - 4 的 AI Agent 平台(AgentGPT)分解用户问题逻辑流,将物理模型通过应用编程接口(APIs)预嵌入 LLMs,实现实时激活。在此框架下,LLMs 能与电化学模型协同工作,为用户提供可靠电池文本信息,还能实现参数输入和基于物理模型的数值结果输出,促进数据和信息实时交互,为 LLMs 训练提供新数据,助力通用人工智能实现。

协同进化系统工作流程


协同进化系统工作流程受特定研究领域知识库插件 LLM 启发。由于 LLM 知识库存在局限性,在回答科学问题时易出现信息编造等问题,尤其在处理电化学定量相关问题时表现不佳。为解决这些问题,研究采用 API 将特定物理模型嵌入 LLMs。

构建了以 AgentGPT 为核心的物理模型预构建系统,通过 APIs 创建多个工具包与 LLMs 关联,使 LLMs 不仅能处理文本信息,还能在用户请求涉及电化学模型计算时,进行语义分析、查询内置数据库,匹配物理模型后通过云计算执行模拟。API 部署包括构建函数模型信息、进行对话测试和部署函数模型三个步骤,确保模型稳定运行和准确执行。

LLMs 与物理模型协作


先进电池研究是复杂系统工程,涉及设计、制造和使用三个主要方面,各方面包含多种物理模型,传统研究方式耗费大量人力和资源。研究提出的协同进化系统,通过将 LLMs 与包含电池知识库的物理模型协作,能快速为研究人员提供相关知识。

以材料形成能评估、电池制造中的干燥过程水分预测和电池使用过程中固体电解质界面(SEI)生长估计三个典型过程为例,展示了物理模型与 LLMs 的集成应用。

在材料形成能评估中,采用密度泛函理论(DFT)计算作为物理模型,但该模拟对用户专业知识要求高。基于协同进化系统设计了自动化计算范式,通过设计 APIs 和提示,实现材料形成能的自动预测和分析,方便无 DFT 模拟经验的实验研究人员探索材料合成可能性。

锂电池制造过程中,电极水分控制对电池性能和安全至关重要。构建数值模型模拟电池真空干燥过程,将电池和干燥箱视为统一控制体,简化为低维模型,考虑干燥过程中的热传导、液体水蒸发和烘箱排气等因素,方便用户定制模型参数进行云计算和预测,优化干燥过程参数,节省时间和成本。

SEI 在电池中起着关键作用,但其在电池充放电循环中可能受损,影响电池性能和寿命。设计了嵌入 LLMs 的 SEI 生长模型工作流程,通过自动化输入接口与电池运行控制系统关联,探索电池循环过程中 SEI 厚度的变化。

协同进化范式能力测试


为测试协同进化范式的能力,以锂离子导体 Li6PS5I 的形成能计算为例。协同进化系统将计算任务分解为六个特定任务,其中晶体结构获取、DFT 模拟参数设置和数据处理计算三个任务对计算准确性至关重要。系统引导缺乏 DFT 计算经验的研究人员从 Materials Project 获取可靠晶体结构,通过 API 辅助定制计算参数,逐步计算出材料形成能。计算结果与数据库预测值基本一致,误差可接受,且验证了其他材料形成能计算的稳定性和可转移性。

将电池真空干燥模型集成到 AgentGPT 中,当用户查询相关问题时,协同进化系统激活模型进行详细计算并提供答案。选择干燥模型中的五个主要输入变量作为用户定制参数,如电池水分含量、干燥温度等。对比嵌入模型前后的对话可知,嵌入模型前,AgentGPT 只能提供基本信息和模拟指南,对非专业人员不友好;嵌入模型后,LLMs 通过云计算具备模拟能力,输出结果符合实际情况,如温度和压力对干燥速率的影响等。

在 SEI 生长模型方面,对比接入模型前后 LLMs 与用户的对话发现,接入前 LLMs 主要依赖现有文献和数据集,在特定模型计算模拟方面存在局限;接入后,LLMs 与 SEI 生长模型协同工作,能为用户提供更准确的信息和模拟结果,有助于深入研究 SEI 在电池使用过程中的变化。

研究总结


本研究提出的基于 Agent 的 LLMs 与物理模型协同进化范式,在先进电池研究中展现出可行性。通过与物理模型结合,LLMs 不仅能进行基于物理的模拟,还能从输出结果收集新数据集,为未来扩展预训练数据库提供支持,推动科研高度自动化。

该系统对人工智能在科研领域的整合具有更广泛的影响,有望激发研究人员关注 Agent AI 与科研的深度融合,促进通用人工智能的发展。未来研究将聚焦于提高模型准确性,建立模型输出数据与自动化系统之间的反馈和调整机制,为其他涉及大量数据和定量关系的研究领域提供参考,推动科研范式变革,最终助力通用人工智能的形成。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号