综述:人工智能时代下的计算药物设计:分子表征、生成架构与性能评估的系统综述
【字体:
大
中
小
】
时间:2025年10月12日
来源:Pharmacological Reviews 17.3
编辑推荐:
本综述系统梳理了AI驱动的生成式药物设计前沿,重点解析了分子表征(1D/2D/3D)、生成模型(VAE/GAN/RL/扩散模型)及评估体系三大维度,为研究者提供了理解表征选择、生成机制与评估范式间复杂互动的统一框架,指明了领域发展瓶颈与未来方向。
药物设计是发现和开发新治疗化合物以应对疾病与医疗状况的过程。近年来,计算方法通过使研究人员能够在实验室合成与测试之前模拟和预测潜在候选药物的行为,显著提升了该领域的效率。这种计算预筛选大幅减少了早期药物开发所需的时间与资源。计算药物设计范式包含多种数学与计算机辅助的方法论,用于建模和分析分子结构与相互作用,其中包括分子动力学模拟、量子力学计算以及日益增多的机器学习算法。
分子表征是计算药物设计的基础,不同表征方法为不同应用提供独特优势。药物分子主要有三种基本表示形式:线性表征、二维(2D)表征和三维(3D)表征。线性表示(例如SMILES字符串或基于序列的编码)计算效率高,但会损失空间和拓扑关系。相比之下,2D图表示(例如分子图)保留了连接性,但可能在处理深度感知任务时遇到困难。而3D表示(例如点云或体积网格)提供了较高的生物保真度,但代价是计算复杂度增加。
深度生成建模彻底改变了计算药物设计,使得创建具有所需特性的新颖分子结构成为可能。在该领域出现了三种主导范式:编码器-解码器架构(如变分自编码器VAE)、生成对抗网络(GAN)以及扩散模型。每种生成架构在处理不同分子表示时表现出不同的优势和局限性。
本节审视了采用线性表示作为药物分子基础表示方法的生成方法。基于线性字符串(如SMILES)的模型通常利用序列生成技术,例如循环神经网络(RNN)或Transformer架构。这些方法在生成速度上有优势,但由于表示本身的内在限制,可能产生无效或语法不正确的分子,需要额外的有效性检查和优化步骤。
分子生成方法的可扩展性和计算需求是其实际应用,尤其是在大规模药物发现中的关键考量。基于模板的方法通过预定义的反应模板和构建块来确保合成可行性,但其效率和可扩展性差异显著。一些研究致力于开发可扩展且成本效益高的从头模板分子生成方案,而其他方法则依赖于小型、精选的片段库,这限制了其大规模应用的潜力。
生成式药物设计模型提供了前所未有的能力,以创造具有特定药理学特性的新分子。该领域主要通过两种机制影响药物开发:性质优化和靶点识别。模型可以引导生成过程,使分子具有特定的生物活性、药代动力学特性或降低的毒性。同时,一些方法整合了靶蛋白的结构信息,直接针对特定的生物靶点生成候选化合物。
该领域的研究采用了多样化的数据集。常见资源包括诸如ZINC、ChEMBL、PubChem和QM9等公共化合物数据库。这些数据集提供了大量已知分子及其性质的信息,用于训练生成模型和评估其输出。蛋白质结构数据集,如PDB(Protein Data Bank),则常用于需要靶点结构信息的3D生成方法。
用于评估分子生成方法的指标主要分为两大类:一类是直接用于比较分析的数值指标(如有效性Validity、新颖性Novelty、独特性Uniqueness、恢复率Recovery rate和RDKit相似性分数SCrdkit),另一类是需要通过统计处理(均值、中位数或分布)才能在生成分子、训练数据集或参考集合之间进行有意义比较的基于属性的指标。
评估生成模型的一个重大挑战在于新颖分子缺乏真实信息(ground truth)。因此,评估要么依赖于简单指标,要么依赖于生成集合上的通用统计度量(如平均值和分布)。为应对此局限,研究人员可以开发具有高生成可控性的方法,从而能够在评估阶段有意地将已知分子从训练集中排除,以便后续生成。此外,当前许多评估指标侧重于计算效率或分子的简单特性,可能无法充分捕捉与药物发现更相关的复杂生物活性和药理学特性。未来的工作需要开发更能反映真实药物开发需求的多维和生物相关的评估标准。
本综述根据分子表示类型(1D、2D和3D)对药物设计方法进行了分类,并审视了相关的数据集和评估指标。由此引出了三个关键问题:不同表示方法如何影响生成模型的效率和效果?当前评估体系能否真正衡量生成分子成为成功药物的潜力?以及未来研究如何弥合计算生成与实验验证之间的鸿沟?未来的发展方向可能包括开发混合表示方法以兼顾计算效率和生物保真度,建立更强大且与临床前研究更相关的多维度评估基准,以及加强生成模型与自动化实验平台的整合以实现闭环式的药物设计与测试。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号