基于定量构效关系(QSAR)与强化学习的 Syk 抑制剂发现新策略

《Journal of Cheminformatics》:Integrating QSAR modelling with reinforcement learning for Syk inhibitor discovery

【字体: 时间:2025年04月16日 来源:Journal of Cheminformatics 7.1

编辑推荐:

  为解决现有 Syk 抑制剂疗效和安全性不佳的问题,研究人员开展了将 QSAR 建模与强化学习相结合发现 Syk 抑制剂的研究。结果得到 139 个有潜力的候选分子,该研究为加速药物发现提供了通用框架,对罕见病治疗药物开发意义重大。

  在医学和生命科学领域,人体就像一个精密复杂的 “小宇宙”,免疫系统则是守护这个 “小宇宙” 的卫士。而脾酪氨酸激酶(Spleen tyrosine kinase,Syk)作为免疫系统中的关键 “角色”,一旦过度活跃,就会引发一系列麻烦,像自身免疫性疾病、过敏性疾病、自身炎症性疾病,甚至某些癌症和心血管疾病都与之有关。以免疫性血小板减少症(Immune thrombocytopenia,ITP)为例,这是一种罕见的自身免疫性疾病,患者血液中血小板数量偏低,严重影响身体健康。目前,虽然有一些 Syk 抑制剂正在进行临床试验,但它们存在诸多问题,比如脱靶效应、疗效不稳定,已获批的药物福他替尼(fostamatinib)也因安全性和疗效数据问题,其发展和临床应用受到限制。所以,寻找更有效、更安全的 Syk 抑制剂迫在眉睫。
在这样的背景下,来自 ITMO 大学化学人工智能中心(Center for AI in Chemistry, ITMO University)的研究人员开展了一项极具创新性的研究。他们将定量构效关系(Quantitative structure–activity relationship,QSAR)建模与强化学习(Reinforcement learning,RL)相结合,致力于发现新型 Syk 抑制剂。这项研究成果发表在《Journal of Cheminformatics》上,为药物研发领域带来了新的曙光。

研究人员在开展研究时,运用了多种关键技术方法。首先,从 ChEMBL 数据库收集了 3513 个 Syk 抑制剂数据,经过预处理后得到 3176 个分子作为研究样本。然后,使用随机森林回归(Random Forest Regression,RFR)、极端梯度提升(eXtreme Gradient Boosting,XGB)等多种经典机器学习模型预测药物分子的抑制能力,并通过堆叠集成(stacking ensemble)方法提升预测性能。最后,采用强化学习方法生成新的药物分子,并根据多种评估指标筛选出有潜力的 Syk 抑制剂。

下面来详细看看研究结果:

  • 预测性 QSAR 模型:研究人员通过比较五种分子表示方法,发现扩展连接性指纹(Extended-connectivity fingerprints,ECFPs)表现最佳。基于此,他们构建了 QSAR 模型。在模型构建过程中,先使用默认参数训练随机森林回归(RFR)、直方图梯度提升(Hist Gradient Boosting,HGB)、极端梯度提升(XGB)和支持向量回归(Support Vector Regression,SVR)这四种模型,再利用 Optuna 库进行超参数优化。最终,将表现最佳的模型作为基础模型,通过堆叠集成技术,得到堆叠回归器(StackingRegressor)。该模型在测试集上表现出色,均方误差(Mean squared error,MSE)低至 0.27,决定系数(Coefficient of determination,R2)高达 0.78,能够有效预测新型 Syk 抑制剂的 pIC50值。
  • 新 Syk 抑制剂的生成:研究人员通过三种不同方法进行新 Syk 抑制剂的生成实验。对比发现,将预训练的 pIC50预测模型纳入奖励函数的方法,不仅能保证分子的独特性,还能增加有效分子的生成数量。该方法在各项评估指标上都优于基线模型,生成的有潜力的抑制剂数量更多、结构多样性更强,pIC50分布也向更高值偏移,表明生成分子的效力得到了提升。
  • 潜在抑制剂的性质分析:经过严格筛选,研究人员从 78012 个生成分子中成功鉴定出 139 个满足预设标准的化合物。通过与已知抑制剂对比,发现这些生成分子的大多数分子描述符分布与实验确认的化合物相符,虽然分子量和可旋转键数量有所降低,但这可能有利于提高潜在药物候选物的药代动力学性质和生物利用度。此外,生成分子的结构新颖性较高,与已知化合物的相似系数大多低于 0.3,且在药物相似性方面表现良好,优于临床测试的 Syk 抑制剂福他替尼。

在研究结论和讨论部分,研究人员成功运用结合深度强化学习与 QSAR 预测模型的新方法,设计出 139 个有潜力的新型 Syk 抑制剂。这些分子具有高预测效力和良好的药物相似性,结构新颖且保留了已知 Syk 抑制剂的分子特征,有望克服现有药物的局限性。该方法不仅加速了 Syk 抑制剂的早期药物发现进程,还为其他治疗靶点的药物研发提供了通用框架,尤其对罕见病治疗药物的开发意义重大。不过,研究也存在一些局限性,比如生成分子的质量依赖于 QSAR 模型的准确性和奖励函数的结构,训练数据的偏差可能影响模型的泛化能力等。未来,研究人员计划对筛选出的候选分子进行实验验证,进一步优化生成模型,并将该方法拓展到其他治疗靶点,如布鲁顿酪氨酸激酶(Bruton’s tyrosine kinase)或叉头盒 M1(Forkhead box M1),为生命科学和医学领域的发展持续贡献力量。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号