综述:大型语言模型与分子化学的结合:人工智能驱动的化学信息学领域进展与挑战的系统性综述

《ARCHIVES OF COMPUTATIONAL METHODS IN ENGINEERING》:Large Language Models Meet Molecules: A Systematic Review of Advances and Challenges in AI-Driven Cheminformatics

【字体: 时间:2025年10月22日 来源:ARCHIVES OF COMPUTATIONAL METHODS IN ENGINEERING 12.1

编辑推荐:

  化学信息学中基于Transformer的大语言模型(LLMs)在分子表征、药物设计等领域展现出显著优势,但面临可解释性、计算成本等挑战。当前研究趋势包括3D建模、量子增强系统及自主AI工作流。

  

摘要

化学数据的迅速增长,加上传统计算方法的局限性,加速了人工智能(AI)在化学信息学中的整合。在各种AI技术中,基于Transformer的大型语言模型(LLMs)已成为表示和推理复杂分子结构的强大工具,推动了从分子性质预测到从头药物设计等任务的进步。本综述全面总结了Transformer如何重塑化学信息学的发展历程,追溯了它们从早期基于规则的系统到现代生成式和多模态架构的演变过程。通过使用PRISMA框架进行系统性的文献分析,我们研究了200多项相关研究,以评估LLMs在解决化学问题方面的当前能力、挑战和趋势。其主要优势包括可扩展性的提升、数据效率的提高,以及从基于序列的格式(如SMILES和SELFIES)中学习全局分子模式的能力。然而,一些持续存在的挑战——如可解释性有限、分词错误和高计算成本——凸显了混合架构、自监督学习以及与领域知识整合的必要性。新兴趋势,如具有3D感知能力的模型、量子增强系统以及自主AI工作流程,预示着LLMs不仅会在化学研究中提供辅助,还将自主推动发现过程。本综述批判性地探讨了AI架构与分子建模领域特定挑战之间的相互作用。通过将深度学习与领域特定的化学知识相结合,本文为研究人员利用Transformer和LLMs在下一代化学信息学中的应用提供了路线图。

化学数据的迅速增长,加上传统计算方法的局限性,加速了人工智能(AI)在化学信息学中的整合。在各种AI技术中,基于Transformer的大型语言模型(LLMs)已成为表示和推理复杂分子结构的强大工具,推动了从分子性质预测到从头药物设计等任务的进步。本综述全面总结了Transformer如何重塑化学信息学的发展历程,追溯了它们从早期基于规则的系统到现代生成式和多模态架构的演变过程。通过使用PRISMA框架进行系统性的文献分析,我们研究了200多项相关研究,以评估LLMs在解决化学问题方面的当前能力、挑战和趋势。其主要优势包括可扩展性的提升、数据效率的提高,以及从基于序列的格式(如SMILES和SELFIES)中学习全局分子模式的能力。然而,一些持续存在的挑战——如可解释性有限、分词错误和高计算成本——凸显了混合架构、自监督学习以及与领域知识整合的必要性。新兴趋势,如具有3D感知能力的模型、量子增强系统以及自主AI工作流程,预示着LLMs不仅会在化学研究中提供辅助,还将自主推动发现过程。本综述批判性地探讨了AI架构与分子建模领域特定挑战之间的相互作用。通过将深度学习与领域特定的化学知识相结合,本文为研究人员利用Transformer和LLMs在下一代化学信息学中的应用提供了路线图。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号