《npj Drug Discovery》:Interaction-constrained 3D molecular generation using a diffusion model enables structure-based pharmacophore modeling for drug design
编辑推荐:
本文介绍了一种名为DiffPharma的创新性结构-药物设计框架。为解决现有方法在生成三维分子时难以精确保持关键蛋白质-配体相互作用的问题,研究人员开发了基于条件扩散模型的交互引导分子生成方法。该方法通过引入交互粒子及多路径自适应融合E(3)-等变图神经网络(MAP-EGNN),显著提升了氢键和疏水相互作用的再现性。实验表明,DiffPharma在保持高结构多样性的同时,实现了高达0.9的残基水平相互作用相似性,并成功应用于SARS-CoV-2主蛋白酶(Mpro)等靶点的抑制剂生成,为理性药物设计提供了新工具。
在药物研发的漫长赛道上,科学家们孜孜不倦地探寻能够精准“狙击”疾病靶点的分子。其中,基于结构的药物设计(Structure-Based Drug Design, SBDD)是一种重要的理性设计方法,它犹如“量体裁衣”,根据靶点蛋白的三维结构来设计与之契合的活性分子。药效团建模(Pharmacophore Modeling)则是SBDD中的关键工具,它从一组活性分子的三维构型中抽象出维持生物活性所必需的立体和电子特征(如氢键供体/受体、疏水区域等),形成一张相互作用的“蓝图”,用于指导新分子的设计或虚拟筛选。随着人工智能技术的飞速发展,利用机器学习模型从头生成新颖的、可结合特定蛋白质口袋的分子,成为探索广阔化学空间、发现全新候选药物的强大策略。
然而,现有的生成模型虽然能够考虑蛋白质的三维结构,但在生成过程中往往只是“隐式地”整合了蛋白质与配体之间至关重要的相互作用信息,导致对关键药效团特征(如氢键、疏水作用)的再现性不足。一些尝试显式引入相互作用引导的研究,又往往对不同类型相互作用一视同仁,未能充分利用各自的特征(如氢键的方向性和距离限制),或者仅能处理单一类型的相互作用。这就像是在黑暗中摸索着拼图,虽然知道大致的形状,却难以精确地对准每一块拼图的卡扣。如何让生成模型“学会”并“遵守”由特定相互作用模式构成的“设计蓝图”,生成既满足复杂空间约束又具有化学合理性的分子,是当前结构-药物设计领域面临的一大挑战。
为了应对这一挑战,来自日本东京工业大学等机构的研究团队在《npj Drug Discovery》上发表了一项创新性研究,提出了名为DiffPharma的新型药效团建模框架。该研究针对如何生成三维分子并精确满足预设的蛋白质-配体相互作用约束这一核心问题,开发了一个基于条件扩散模型(Conditional Diffusion Model)的生成系统。研究团队创造性地将氢键和疏水相互作用等关键药效特征建模为空间中的“交互粒子”,并设计了称为“多路径自适应融合E(3)-等变图神经网络(Multi-path Adaptive fusion E(3)-equivariant Graph Neural Network, MAP-EGNN)”的专用架构来处理和整合不同类型相互作用的信息。该模型能够在靶蛋白口袋内,根据用户指定的相互作用模式,直接生成具有正确三维构象的分子,实现“交互感知的骨架跃迁(Interaction-aware Scaffold Hopping)”。
这项研究主要应用了以下几个关键技术方法:首先,研究基于去噪扩散概率模型(Denoising Diffusion Probabilistic Model, DDPM)框架,构建了一个条件分子生成模型。其次,创新性地提出了“交互粒子”框架,将氢键和疏水相互作用路径离散化为携带特定角色(如锚定粒子、功能粒子)的粒子节点,用于在三维空间中精确引导分子生成。第三,设计了核心神经网络架构MAP-EGNN,它包含三个分别处理蛋白质-配体、配体-氢键、配体-疏水相互作用的专用E(3)-等变图卷积层子网络,并通过“偏置融合”和“均匀融合”两种机制将不同子网络提取的特征进行语义融合,以平衡地满足多种交互约束。研究数据主要基于CrossDocked2020数据集构建的训练和测试集。此外,在案例验证中,综合运用了分子对接(Vina-GPU+)、分子动力学(Molecular Dynamics, MD)模拟(Desmond模块)、结合自由能计算(分子力学广义玻恩表面积,MM/GBSA)、逆合成分析(SciFindern)以及ADMET性质预测(ADMETlab 3.0)等多种计算生物学和药物化学方法进行综合评估。
研究结果
1. DiffPharma模型概述
DiffPharma是一个基于条件扩散模型的交互引导三维分子生成框架。其核心创新在于两点:一是将氢键和疏水相互作用明确表示为具有空间位置和取向的“交互粒子”作为生成条件;二是设计了MAP-EGNN网络架构。MAP-EGNN包含三个并行的子网络,分别处理蛋白质-配体关系、氢键交互和疏水交互,然后通过两种融合机制(偏置融合和均匀融合)整合信息,确保模型能同时、平衡地满足多种交互约束,并保持E(3)-等变性(即旋转和平移不变性)。
2. 交互再现性
为评估生成分子对预设相互作用模式的复现能力,研究计算了生成分子与参考配体在残基水平上的交互谱的余弦相似度。在包含100个蛋白质-配体复合物的测试集上,DiffPharma在氢键、疏水相互作用及总相互作用上的再现性均显著优于Pocket2Mol、FLAG、DiffSBDD、DeepICL、MolCRAFT和DiffInt六个基线模型。DiffPharma生成分子的总交互相似度分布峰值接近0.9,表现出极高的交互模式保真度,且能平衡地复现氢键和疏水相互作用,而基线模型往往在某一类交互上表现较好。
3. 评估交互引导分子生成的化学可行性
为检验模型的普适性,研究针对两个额外的药物靶点蛋白:AKT丝氨酸/苏氨酸激酶1(PDB ID: 3CQW)和丝氨酸β-内酰胺酶(PDB ID: 1L2S),基于其参考配体的交互模式生成了新的配体分子。生成的分子在成功保留关键氢键和疏水相互作用模式的同时,展现了结构多样性。对筛选出的高类药性(Quantitative Estimate of Drug-likeness, QED)得分分子进行逆合成分析,证实了其具有可行的合成路径。值得注意的是,部分生成的分子是已在PubChem等数据库中注册的已知稳定化合物,支持了该方法的化学可行性。
4. 针对SARS-CoV-2 Mpro的药物发现案例研究
选择SARS-CoV-2主蛋白酶(Mpro)作为一个实际的药物发现案例。研究以非共价抑制剂复合物(PDB ID: 7GBL)为参考,设定了包含与GLU166形成氢键在内的一系列交互约束。研究比较了包含(GLU+)与排除(GLU-)GLU166氢键约束两种条件下生成分子的差异。
- •
空间分布:GLU+条件下生成的分子,其氢键受体原子高度集中在GLU166残基周围;而GLU-条件下则呈现更分散的分布,表明明确的氢键约束能精确引导原子的几何排布。
- •
动态稳定性:对筛选出的分子进行20纳秒的分子动力学模拟。GLU+条件下生成分子的配体均方根偏差(RMSD)与参考配体相当,表明结合构象稳定;而GLU-条件下的分子RMSD随时间增长,稳定性较差。
- •
结合亲和力趋势:基于MD轨迹的MM/GBSA计算表明,GLU+条件下生成分子的平均相对结合自由能(ΔΔGbind)优于GLU-条件。在GLU+条件下,有三个生成分子的ΔΔGbind甚至优于参考配体。这些分子在MD模拟中能稳定维持与GLU166的氢键。
- •
重现已知生物活性化合物:仅基于靶点蛋白结构和交互约束,DiffPharma成功从头生成了与参考抑制剂7GBL完全相同的分子,该分子具有实验验证的抑制活性(IC50= 88.3 μM),且三维结合模式高度一致。
- •
类药性与ADMET性质:对GLU+条件下生成的分子进行ADMET(吸收、分布、代谢、排泄、毒性)性质预测。大多数分子在分子量、氢键供受体数、拓扑极性表面积、合成可及性、渗透性、口服生物利用度、血脑屏障穿透性、代谢稳定性、半衰期、hERG心脏毒性风险和急性口服毒性等指标上均满足类药性要求,显示出良好的开发潜力。
研究结论与讨论
本研究提出了一个名为DiffPharma的、基于条件扩散模型的结构-药效团建模框架,用于生成三维分子。该框架通过引入“交互粒子”来显式表示多种分子相互作用,并利用专门的MAP-EGNN架构来提取和整合不同交互类型的特征。
首先,在包含100个蛋白-配体复合物的基准测试中,DiffPharma实现了最高的交互模式再现性。其次,通过对AKT1和β-内酰胺酶两个靶点的配体设计,证明了该方法在保持关键交互模式的同时,能够生成结构多样的分子,具备良好的普适性。最后,以SARS-CoV-2 Mpro为案例的实践研究表明,DiffPharma能够通过选择性地应用交互约束来控制生成分子的药效团空间特征。生成的分子在MD模拟中表现出与已知活性参考配体相当的结合构象稳定性,MM/GBSA计算提示部分分子具有更有利的结合趋势。尤为重要的是,该方法仅凭蛋白结构和交互约束,就成功重现了实验验证的活性参考分子。此外,ADMET谱分析表明生成分子具有良好的类药性和药代动力学性质。
尽管DiffPharma成功复现了测试集的平均分子属性(如QED、LogP),但它并未包含专门优化此类理化性质的模块。未来的工作可以探索多目标优化策略,以同时控制药效团相互作用和分子属性。当前DiffPharma专注于氢键和疏水相互作用建模,而蛋白质-配体结合还涉及π-π堆积、阳离子-π相互作用、盐桥、卤键等其他作用类型。MAP-EGNN架构具有良好的可扩展性,为未来整合更多交互表征预留了空间。
总之,这项研究展示了一种通过交互引导的分子设计方案来加速未来药物发现的 promising 方向。DiffPharma框架为在广阔且未被探索的化学空间中,理性设计满足特定三维相互作用约束的新颖先导化合物提供了强大工具。