基于机器学习的筛选方法以及通过模拟验证的有效JAK3抑制剂,用于癌症治疗
《PLOS One》:Machine learning-guided identification and simulation-based validation of potent JAK3 inhibitors for cancer therapy
【字体:
大
中
小
】
时间:2025年12月15日
来源:PLOS One 2.6
编辑推荐:
JAK3抑制剂研究通过机器学习筛选25,084个化合物,随机森林模型(AUC=0.80)识别400个候选,结合分子对接、动力学模拟和ADMET分析验证,最终CHEMBL4117527(MM/GBSA自由能-29.5 kcal/mol)等化合物显示高亲和力、稳定结合及良好安全性。
该研究提出了一种整合机器学习(ML)、分子对接、分子动力学(MD)模拟和量子化学计算(DFT)的多层级计算策略,用于高效筛选和验证新型选择性JAK3抑制剂。研究以JAK3在免疫调节和肿瘤进展中的关键作用为背景,针对传统JAK抑制剂泛效性差、安全性不足的问题,构建了从虚拟筛选到结构验证的完整流程。
在数据建模阶段,研究团队从ChEMBL数据库提取了包含12,356个化合物的JAK3抑制剂数据集,通过过滤缺失活性数据、剔除IC50>10,000nM无效化合物等预处理手段,最终保留了3,872个可用于建模的样本。采用MACCS分子指纹(含166个结构特征)结合递归特征消除(RFE)算法,成功将随机森林模型(AUC=0.80,F1=0.92)优化为最佳分类器,其预测精度显著高于决策树(AUC=0.73)、支持向量机(AUC=0.76)和朴素贝叶斯(AUC=0.65)等算法。
虚拟筛选阶段,基于随机森林模型的预测结果,从25,084个ChEMBL化合物中筛选出400个高置信度候选分子。通过 Glide模块对接分析发现,前10名候选分子均与JAK3蛋白活性口袋形成稳定结合(亲和力<-8.5 kcal/mol)。值得注意的是,编号为CHEMBL4117527的化合物在分子对接中展现出–9.051 kcal/mol的极强结合能,且与已知抑制剂PF-06651600共享关键结合残基(Leu108、Arg156、Asn157等),形成6-8个氢键网络。
在结构验证环节,针对TOP3候选分子(CHEMBL49087、CHEMBL4117527、CHEMBL50064)进行的200ns分子动力学模拟显示,所有复合物在平衡后均保持RMSD<0.20nm的稳定构象。特别的是,CHEMBL4117527的RMSD值(0.14nm)与晶格结构(0.13nm)高度一致,表明其结合模式具有最优的动态稳定性。溶剂可及表面积(SASA)分析进一步证实,所有候选分子均维持168-172nm2的稳定暴露区域,与靶点蛋白构象无显著偏离。
结合MM/GBSA和MM/PBSA两种自由能计算方法,CHEMBL4117527显示出最优异的复合物稳定能(–29.5 kcal/mol,MM/GBSA;–26.1 kcal/mol,MM/PBSA)。量子化学计算揭示该化合物具有最窄的HOMO-LUMO能隙(3.38eV)和最高化学软度(0.23eV),这与其在MD模拟中表现出的最佳构象稳定性相吻合。ADMET分析表明,所有候选分子均满足Lipinski规则五项标准(分子量<500Da,logP<5),其中CHEMBL4117527的logD值(2.15)和GIA值(0.82)均处于最优区间,展现出良好的口服生物利用度。
毒性预测数据显示,三个候选分子均属于低急性毒性(LD50>1300mg/kg)类别,且未显示致癌性、致畸性等风险信号。值得注意的是,CHEMBL4117527的离子化势能(5.93eV)和电负性(3.82eV)与已上市JAK抑制剂托法替布(5.21eV,3.85eV)高度相似,这为结构优化提供了重要方向。
该研究创新性地将机器学习预测与物理化学验证相结合:首先通过随机森林模型实现高效虚拟筛选,再利用分子对接锁定高亲和力候选;接着通过分子动力学模拟验证动态稳定性,最后结合MM/GBSA和DFT计算揭示电子相互作用机制。这种四维验证体系(ML预测+对接筛选+MD动态+DFT电子)显著提升了候选分子的可靠性,其中CHEMBL4117527在多项指标上超越已知抑制剂,特别是在保持JAK1/JAK2选择性方面表现出独特优势。
研究同时揭示了JAK3活性口袋的构效关系新规律:(1)Leu31-Glu106-Arg156形成刚性氢键桥,可同时容纳不同构型的抑制剂分子;(2)Asp170口袋的极性环境要求抑制剂必须具备特定的pKa值(7.2±0.5);(3)Val39-Met105形成的疏水口袋对分子的共平面性和刚性要求较高。这些发现为后续结构优化提供了关键靶点,例如通过调整苯环取代基的电子效应来增强与Arg156的静电相互作用。
在计算方法优化方面,研究团队开发了双验证机制:先用随机森林模型(AUC=0.80)进行初筛,再用XGBoost模型(AUC=0.85)进行二次验证,有效避免了数据过拟合问题。分子对接阶段引入了柔性附件采样(FA sampling)技术,使预测的结合模式与实验X射线衍射结果吻合度达到92%。在MD模拟中,采用NVT(100ps)和NPT(100ps)两阶段平衡策略,确保了复杂蛋白-配体系统在生理条件下的稳定模拟。
该工作为JAK3抑制剂开发提供了重要参考:首先证实了机器学习模型在JAK家族中选择性抑制剂筛选中的可行性,其次建立了基于电子结构的稳定性预测新方法,最后揭示了JAK3与同类激酶在活性口袋关键残基(如Leu108、Asp170)上的差异特征。这些成果不仅推动了计算药物化学的发展,更为后续的实验验证指明了方向,特别是CHEMBL4117527作为新型候选分子,其与靶点的结合模式与已知的ATP类似物存在显著差异,可能为开发新型JAK3选择性抑制剂提供结构基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号