机器学习框架结合计算机辅助药物设计预测鞘氨醇激酶1抑制剂的创新研究

【字体: 时间:2025年06月05日 来源:Computers in Biology and Medicine 7.0

编辑推荐:

  本研究针对鞘氨醇激酶1(SphK1)在癌症进展和化疗耐药性中的关键作用,开发了集成机器学习(ML)与计算机辅助药物设计(CADD)的创新框架。团队采用随机森林(RF)、AdaBoost决策树(ABDT)等算法,从534个化合物中筛选出187个潜在抑制剂,其中RF模型准确率达89.81%。通过分子动力学(MD)模拟和MM/GBSA结合能计算,证实IS01265等化合物与SphK1结合稳定,为靶向抗癌药物开发提供了高效计算工具。

  

鞘氨醇激酶1(Sphingosine kinase 1, SphK1)是调控细胞命运的关键"代谢开关",其介导的鞘氨醇-1-磷酸(S1P)信号通路在癌症转移、血管生成和化疗耐药中扮演核心角色。随着肿瘤靶向治疗的发展,SphK1已成为对抗三阴性乳腺癌、结直肠癌等难治性肿瘤的热门靶点。然而传统抑制剂开发面临两个瓶颈:实验筛选耗时耗力,现有化合物如PF-543存在生物利用度不足等问题。这促使科学界寻求将人工智能与计算生物学相结合的创新解决方案。

中国科学院的研究人员Mushtaq Ahmad Wani团队在《Computers in Biology and Medicine》发表的研究中,构建了首个集成多模态机器学习与分子模拟的SphK1抑制剂发现平台。研究通过收集2009-2024年间32篇文献和2项专利中的534个化合物构建训练集,采用RDKit计算210维分子特征,经Boruta算法筛选关键描述符后,系统比较了决策树(DT)、支持向量机(SVM)、随机森林(RF)等6种算法的预测性能。最终通过100纳秒分子动力学模拟和MM/GBSA结合自由能计算验证候选分子,并评估其类药性。

训练数据集收集
团队从34项研究中整理出234个活性/300个非活性化合物,涵盖PF-543等已知抑制剂结构。通过RDKit生成的二维描述符包括拓扑极性表面积(TPSA)、脂水分配系数(AlogP)等特征,经RobustScaler标准化后,Boruta算法筛选出决定抑制活性的35个关键特征,如氢键供体数、芳香环计数等。

结果和讨论
在70:30划分的训练/测试集上,RF模型表现最优(准确率89.81%,F1-score 0.88),其特异性达90%可有效减少假阳性。ABDT模型则展现出最佳的召回率(88.34%)。将模型应用于2173个内部化合物库,成功预测出187个潜在抑制剂,验证了模型的泛化能力。MD模拟显示IS01265在SphK1结合口袋中RMSD<2?,结合能(-94.52 kcal/mol)仅次于临床候选药PF-543(-101.25 kcal/mol)。关键相互作用分析发现,稳定的π-π堆叠(Tyr185
)和氢键网络(Asp178
)是高效结合的分子基础。

结论
该研究建立了首个融合机器学习与多尺度模拟的SphK1抑制剂发现框架,其RF模型预测精度超越传统虚拟筛选方法。特别值得注意的是,新发现的IS00998不仅具有优异溶解度(logS>3),其结合模式通过Asp178
的强氢键作用实现稳定锚定。这项工作的创新性体现在三方面:首次系统比较了6种ML算法在SphK1抑制剂预测中的性能;通过MD模拟揭示了结合口袋的动态稳定性特征;提出的计算流程可缩短抑制剂发现周期约60%。这些发现为开发克服化疗耐药的新型靶向药物提供了重要理论工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号