编辑推荐:
为解决药物研发成本效益低的问题,研究人员开发 DrugDiff 模型,可生成有特定属性的小分子,助力药物研发。
在药物研发的漫长征程中,成本与收益的天平正逐渐失衡。近年来,药物研发的成本不断攀升,而产品的产出却不尽如人意,研发成本与收益的比例愈发悬殊。这一现状使得整个行业面临着巨大的挑战,也促使科研人员不断探索新的方法来扭转这一局面。
在此背景下,来自 [未提及第一作者单位] 的研究人员开展了一项极具创新性的研究。他们将目光聚焦于深度学习领域的扩散模型,致力于开发一种能够加速药物研发早期阶段的工具。经过不懈努力,他们成功开发出了一种名为 DrugDiff 的潜在扩散模型,相关研究成果意义重大,为药物研发开辟了新的道路。该研究目前暂未提及发表期刊。
在这项研究中,研究人员运用了多种关键技术方法。首先是变分自编码器(VAE),它能将分子的 SELFIES(一种分子表示形式)映射到潜在空间,为后续的扩散模型提供基础。其次是基于 Rombach 等人的实现构建的潜在扩散模型,具体采用了去噪扩散概率模型(DDPM)架构,通过逐步去除噪声来生成分子的潜在表示。此外,研究人员还训练了一系列分子属性预测器,用于在扩散过程中引导生成具有特定属性的分子。
下面来看具体的研究结果:
- 无引导生成小分子:研究人员首先对 DrugDiff 模型进行无引导生成实验,生成了 10,000 个分子,并与从 VAE 潜在空间采样的分子进行对比。结果显示,DrugDiff 生成的分子结构多样,在新颖性、独特性和化学多样性方面得分较高,且与 VAE 生成分子的属性分布高度重叠。这表明 DrugDiff 能够充分学习训练数据的分布,在无引导情况下也能生成高质量的小分子。
- 单属性引导:为验证 DrugDiff 在属性引导下生成分子的能力,研究人员针对多种分子属性进行实验。以 logP、合成可及性等属性为例,通过不同强度的引导生成分子。结果发现,对于连续值属性,随着引导强度变化,分子属性密度呈现明显的渐进式移动;对于离散属性,也能在强引导下实现属性值的富集。此外,研究人员还以人类雌激素受体 ESR1 为靶点,生成低估计自由结合能的配体。经过筛选,得到的部分配体与已知拮抗剂相比,预测结合能力更强。
- 多属性引导:在药物研发中,同时操纵多个分子属性至关重要。研究人员以 logP 和重原子数量为例,设置四种不同的属性组合场景进行实验。结果显示,DrugDiff 在多数场景下能够生成符合预期属性分布的分子,通过主成分分析(PCA)也能明显区分不同场景下生成的分子。不过,在低 logP 且高重原子数量的场景中,模型实现起来相对困难。
综合研究结果和讨论部分,DrugDiff 具有诸多重要意义。与现有小分子生成模型相比,DrugDiff 的设计更加灵活。它采用预测器引导的方式,避免了传统条件训练中因属性变化需重新训练整个模型的问题,仅需训练和插入化学属性预测器即可添加新属性。同时,通过使用潜在扩散模型,VAE 可轻松替换,以适应不同的分子表示形式。不过,研究也指出,在多属性引导时,需合理选择属性组合,以确保生成分子的高产出。在与其他先进模型的比较中,DrugDiff 的性能相当,且在合成可及性优化方面表现更优。未来,研究人员计划进一步拓展 DrugDiff 的应用,包括纳入更复杂的属性,如结合选择性和系统生物学效应;使用更大的数据集进行训练,以覆盖更广阔的化学空间;优化 VAE 以提升潜在空间的质量;将子结构优化纳入框架,并开展从虚拟生成到实验评估的端到端实验,以更准确地评估该模型对药物研发进程的加速作用。DrugDiff 的出现为小分子药物研发带来了新的希望和方向,有望推动整个药物研发领域取得新的突破。