
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于潜在条件等变扩散的靶向配体生成新方法PoLiGenX在药物发现中的应用研究
【字体: 大 中 小 】 时间:2025年06月01日 来源:Journal of Cheminformatics 7.1
编辑推荐:
研究人员针对结构药物设计中配体生成缺乏特异性与多样性平衡的问题,开发了潜在条件等变扩散模型PoLiGenX。该模型通过结合蛋白质口袋条件与参考配体潜在编码(z∈Rk),生成形状相似(Tanimoto相似度0.87)且化学多样性更高(相似度0.33)的配体。实验显示生成配体具有更优的Vina结合能(-6.88±2.12 kcal/mol)、更低应变能(265.88 kcal/mol)和更高氢键恢复率(47.94%),显著推进了靶向药物设计进程。
在人工智能与药物发现交叉领域,如何生成兼具高靶向性和化学多样性的配体分子一直是核心挑战。传统方法如无条件扩散模型(如EQGAT-diff)虽能生成新配体,但常忽视与参考分子的结构相似性,导致生成分子可能偏离治疗需求。更棘手的是,现有模型难以同时优化结合亲和力、合成可及性(SA)和药物相似性(如Lipinski规则),这严重制约了其在先导化合物优化阶段的实用性。
针对这一瓶颈,欧洲玛丽·居里行动计划资助团队开发了PoLiGenX(Pocket-based Ligand Generator for hit eXpansion)。这项发表于《Journal of Cheminformatics》的研究创新性地将潜在条件机制引入等变扩散模型,通过参考配体的128维潜在编码(z)引导生成过程,在保持形状相似性(Tanimoto 0.87)的同时实现化学空间探索(相似度0.33)。该系统生成的配体不仅结合能(-6.88 kcal/mol)优于CrossDocked测试集(-6.85 kcal/mol),其应变能(265.88 kcal/mol)更显著低于DiffSBDD模型(844.79 kcal/mol),且SA评分(0.68)优于无条件模型(0.58)。
关键技术包括:1)联合训练EQGAT图神经网络编码器(2M参数)与扩散模型(13.4M参数);2)自适应层归一化(AdaLN)融合潜在变量;3)重要性采样算法整合SA等性质约束;4)基于CrossDocked2020数据集(5?截断半径)的PL复合物构建策略。
研究结果方面:
形状与化学相似性
通过500步扩散过程生成的配体,其形状相似性(0.87 vs 0.64)和化学相似性(0.33 vs 0.12)均显著优于无条件模型。UMAP可视化显示潜在空间能有效区分不同靶标配体簇。
结合与构象特性
QuickVina2评估显示,生成配体平均结合能为-6.88 kcal/mol,前10%样本达-7.77 kcal/mol。局部能量优化后Vina评分min为-5.85 kcal/mol,优于DiffSBDD(-4.25 kcal/mol)。应变能(249.71 kcal/mol)和空间冲突(5.99次)指标均优于对比模型。
药物特性与可合成性
Lipinski规则符合数达4.28±1.19,SA评分0.74(SA引导版本),且logP(1.69±2.98)和氢键供体数(3.28±2.39)均符合药物标准。氢键恢复率(50.12%)较无条件模型提升81.6%。
讨论与展望
该研究通过潜在条件机制实现了配体生成的可控性,参数λ∈(0,1]可调节参考配体影响力。相比传统方法,PoLiGenX在保持参考分子药效团的同时,通过等变扩散探索了更广阔的化学空间。未来可扩展至动态蛋白构象处理,或整合更多性质预测模块。这项技术为基于结构的药物设计提供了新范式,特别在先导化合物优化阶段展现出显著优势。
生物通微信公众号
知名企业招聘