综述:揭示扩散模型在小分子生成中的潜力

【字体: 时间:2025年06月25日 来源:Drug Discovery Today 6.5

编辑推荐:

  这篇综述系统阐述了扩散模型(DMs)在药物研发中生成小分子结构的突破性进展,涵盖理论原理(如DDPM框架、SE(3)-等变性)、分子表征(1D/2D/3D)及靶向/非靶向生成策略,对比了QM9等数据集上18种模型的性能,为克服传统药物发现的高成本、长周期瓶颈提供了AI驱动的创新方案。

  

扩散模型:重塑药物设计的分子生成革命

Abstract
生成式人工智能(AI)正为化学家打开药物设计的新思路,其中扩散模型(DMs)凭借其从噪声中迭代生成数据的能力,成为探索化学空间的有力工具。本文综述了DMs在分子生成中的最新进展,从理论框架到实际应用,揭示了其在加速药物研发中的潜力。

Introduction
传统药物发现面临周期长、成本高、失败率高等挑战,而AI驱动的虚拟筛选可显著提升效率。DMs通过正向扩散(逐步添加噪声)和反向扩散(逐步去噪)过程,能够生成具有特定性质的3D分子结构,超越了VAE和GAN等传统模型。分子表征方式(如SMILES、2D图、3D点云)的多样性为DMs提供了丰富的输入形式,而SE(3)-等变性的引入则确保了生成结构的几何合理性。

The proposed taxonomy
DMs可分为“靶向无关”和“靶向相关”两类。前者用于探索广阔化学空间,后者则专注于生成与特定蛋白质靶点结合的配体。这一分类为研究者提供了清晰的导航框架。

Overview of diffusion models
DMs的核心在于通过神经网络学习噪声的逐步去除,从而从高斯噪声中恢复数据分布。DDPM框架定义了理论上的正向和反向扩散过程,其中反向扩散通过预测噪声实现数据重建。

Basic formulations
DDPM的正向扩散过程q(xt|xt-1)逐步将数据x0转化为噪声xT,而反向过程q(xt-1|xt,x0)则通过神经网络pθ(xt-1|xt)估计,最终生成符合目标分布的分子结构。

Equivariant diffusion models
等变性(如SE(3))确保分子性质在坐标变换下保持一致,这对3D分子生成至关重要。通过引入等变性约束,DMs能够生成几何合理的结构。

Diffusion models for molecule generation
分子生成需同时处理连续坐标(如原子位置矩阵X∈Rn×3)和分类特征(如原子类型)。DMs通过扩散过程直接处理坐标,并将分类特征转化为概率编码,实现端到端生成。

Neural network architectures
U-Net和Transformer最初用于图像生成,而图神经网络(GNNs)和消息传递神经网络(MPNNs)因其对分子结构的天然适配性成为主流。

Target-free generation
QM9数据集被广泛用于评估非靶向生成,涵盖几何、电子和热力学性质。模型需平衡有效性、独特性和新颖性,而MiDi等表现优异。

Target-aware generation
靶向生成聚焦于蛋白质-配体结合,CrossDocked2020是常用基准。模型需结合蛋白口袋信息生成稳定配体,但能量合理性和结合姿态仍是挑战。

Benchmarking representative DMs
18种模型在QM9、GEOM-Drugs和CrossDocked2020上的评估显示,靶向模型在结合亲和力优化上表现突出,但普遍缺乏物

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号