基于强化学习与大语言模型的DrugGen:革新药物发现的高效生成平台

【字体: 时间:2025年04月19日 来源:Scientific Reports 3.8

编辑推荐:

  传统药物设计面临化学与生物复杂性挑战,临床失败率高。伊朗伊斯法罕医科大学团队开发DrugGen模型,通过监督微调(SFT)和近端策略优化(PPO)增强DrugGPT架构,结合PLAPT结合亲和力预测和定制化无效结构评估器,实现100%有效分子生成(DrugGPT为95.5%),结合亲和力提升24%(7.22 vs 5.81),分子对接验证其对FABP5等靶点的优越结合能力(-9.537 vs 参考分子-6.177),为药物重定位和全新药效团设计提供新范式。

  

药物发现领域长期面临"高投入、低产出"的困境,临床阶段候选药物失败率超过90%,主要源于传统方法难以有效探索庞大的化学空间和复杂的生物靶点相互作用。尽管深度学习模型如DrugGPT通过Transformer架构生成靶向分子,但仍存在结构有效性不足(4.5%无效生成)、缺乏已批准药物特性整合等问题。针对这些瓶颈,伊朗伊斯法罕医科大学再生医学研究中心的Mahsa Sheikholeslami团队开发了DrugGen系统,相关成果发表于《Scientific Reports》。

研究采用三阶段技术路线:1) 数据集构建:从DrugBank 5.1.10获取1,660个已批准药物及其2,093个靶点序列,整合UniProt、ChEMBL和ZINC20数据库信息;2) 模型优化:基于DrugGPT架构,先通过监督微调(SFT)训练序列-SMILES对,再采用近端策略优化(PPO)结合PLAPT(蛋白-配体结合亲和力预测Transformer)的奖励反馈机制;3) 评估体系:建立包含有效性、多样性(Tanimoto相似性指数)、新颖性和结合亲和力的多维评价指标,并运用Schrodinger套件的GLIDE进行XP精度分子对接验证。

"DrugGen有效微调已批准药物-靶点数据集"部分显示,SFT训练3个epoch后损失函数趋于稳定,PPO优化20个epoch后奖励曲线达到平台期。针对ACE、PPARG等8个靶点(含6个无批准药物的新靶点)的测试表明,模型生成有效性达99.9%,显著优于DrugGPT的95.45%(P<10-38)。

"DrugGen生成有效、多样且新颖的小分子"章节揭示,虽然生成分子多样性指数(60.32% vs 84.54%)和新颖性(41.88% vs 66.84%)有所降低,但研究者强调这反映了对已批准药物特征的合理继承。值得注意的是,针对FABP5等靶点生成的分子在保持结构多样性的同时,仍显著提高了结合亲和力。

"DrugGen生成高靶点亲和力小分子"部分通过PLAPT评估显示,除FABP5外,其余7个靶点的预测结合亲和力中位数提升至7.22[6.30-8.07],较DrugGPT的5.81[4.97-6.63]提高24%(P<10-85)。分子对接实验证实,NAMPT40(-8.381)和FABP5/11(-9.537)等分子显著优于参考化合物Daporinad(-8.300)和棕榈酸(-6.177),且对NAMPT靶点还发现了全新药效团。

讨论部分指出,DrugGen的创新性体现在:1) 首次将PPO强化学习与LLM结合用于药物生成;2) 通过已批准药物特征库提升临床转化潜力;3) 建立包含PLAPT和定制化RDKit评估器的多维度奖励系统。虽然存在对多结合位点靶点(如ACE)的定向生成不足等局限,但该模型已实现从"随机生成"到"定向优化"的跨越。研究者建议未来可整合PocketGen等蛋白口袋设计工具,形成"靶点-口袋-配体"协同优化系统。这项研究为加速药物发现提供了兼具创新性和实用性的AI解决方案,特别在针对糖尿病肾病等疾病的靶点开发中展现出重要应用价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号