通过机器学习发现针对β2-肾上腺素受体的高效且多样的激动剂

《ACS Pharmacology & Translational Science》:Discovering Potent and Diverse Agonists for the β2-Adrenergic Receptor via Machine Learning

【字体: 时间:2025年11月03日 来源:ACS Pharmacology & Translational Science 3.7

编辑推荐:

  β?肾上腺素受体(β?AR)是呼吸系统疾病治疗的关键靶点,但现有药物存在毒副作用问题。本研究通过整合机器学习(ML)与计算药物设计(CADD)工具,包括分子对接、分子动力学(MD)模拟和MM/PBSA自由能计算,从1900万分子库中高效筛选出三种新型β?AR激动剂(alpha-β?-007、alpha-β?-008、alpha-β?-009),其EC50值分别为19.3 nM、0.19 nM和13.9 nM,显著优于阳性对照芬妥罗尔(EC50=196 nM)。通过结构相似性分析发现,新化合物与已知药物结构差异显著(Tanimoto相似度均低于0.37),且在分子对接和MD模拟中表现出稳定的盐桥、氢键及π-π堆积相互作用。纳米生物共振能量转移(NanoBRET)实验证实其高效激活β?AR的能力,并初步评估显示良好生物利用度及低遗传毒性、致癌性和刺激性风险。

  在现代药物研发过程中,筛选具有不同化学结构的化合物是一项至关重要的任务。这一过程不仅能够为研究人员提供更多的选择空间,还能够在一定程度上避免侵犯专利,规避相似化合物可能存在的潜在毒性,并探索新的药理功能。G蛋白偶联受体(GPCRs)是膜蛋白的重要家族,它们在细胞信号传导中发挥着核心作用,同时也是药物开发的重要靶点。以β?-肾上腺素受体(β?AR)为代表的A类GPCR,广泛被激动剂靶向以治疗呼吸系统疾病。尽管目前市场上已有多种β?AR激动剂,但对药物安全性、有效性和选择性的进一步优化仍是一个迫切的需求。本研究结合了机器学习(ML)方法与其他计算方法,从包含1900万分子的化合物库中高效筛选出针对β?AR的激动剂。通过细胞功能实验验证,我们发现了几个具有极高活性的激动剂,其EC??值范围在0.2–20 nM之间,且化学结构与之前报道的分子具有显著差异。这些结果表明,机器学习计算方法在设计新型药物候选分子方面具有广阔前景。

### 高通量虚拟筛选的潜力

高通量虚拟筛选(HTVS)使得研究人员能够在短时间内探索大量化合物库的生物活性特征,从而显著提高识别具有多样化骨架结构化合物的可能性。这一方法的原理在于,化学多样性往往意味着生物和药理学的多样性,因此化学结构多样的分子可能有助于避免专利纠纷,并为实现理想的生理功能和安全性提供新的起点。然而,化学多样性并不总是直接等同于药理活性的多样性,因此,需要通过其他方法进一步筛选和优化。本研究采用了一种系统性的筛选流程,包括机器学习模型预测、虚拟筛选、分子对接、分子动力学(MD)模拟以及最终的实验验证。这一流程不仅提高了筛选效率,还确保了筛选出的化合物具有良好的药理活性和潜在的药物特性。

### 机器学习模型的构建与评估

本研究构建了多个机器学习分类模型,以预测β?AR激动剂的活性。通过对训练数据集的分子结构进行分析,我们发现所有1386个分子都包含芳香环结构,其中1133个分子同时具有芳香环和乙醇胺基团。这些结构特征被认为是β?AR激动剂的典型药效团。为了提高模型的预测能力,我们采用了多种分子指纹和描述符,包括Morgan指纹、MACCS指纹、RDK指纹和PaDEL描述符,并结合了三种机器学习算法:随机森林(RF)、支持向量机(SVM)和XGBoost。通过交叉验证和模型评估,我们选择了表现最佳的三个模型,分别为SVM_Morgan指纹、RF_RDK指纹和XGBoost_PaDEL描述符。这些模型在训练和测试数据集上均表现出良好的性能,例如AUC-ROC和AUC-PRC值接近1.00,F1分数达到0.90以上,表明它们具有较强的判别能力和泛化能力。此外,通过SHAP分析,我们进一步解析了这些模型的特征重要性,发现某些局部化学片段对活性预测具有显著影响,如氢键供体数量、分子极性相关的拓扑指数等。

### 与传统方法的对比

为了验证机器学习模型在筛选活性化合物方面的优势,我们还采用了基于已知药效团的子结构搜索方法进行比较。我们使用SMARTS表达式定义了β?AR激动剂的典型药效团(芳香环和烷醇胺基团),并将其应用于相同的数据集进行子结构匹配。这些匹配结果被视为基于规则的分类预测,并与实验标签进行比较。结果显示,基于药效团的子结构搜索方法在准确率、精确率、召回率和F1分数上均低于机器学习模型,表明机器学习方法在捕捉更复杂的结构-活性关系方面具有显著优势。传统方法通常依赖于已知的药效团特征,而机器学习模型则能够从数据中自动学习更高级的结构信息,从而实现更全面的活性预测。

### 化合物筛选流程

在筛选过程中,我们首先利用机器学习模型对化合物库进行初步筛选,识别出可能具有活性的分子。随后,我们采用分子对接技术,分析这些分子与β?AR的结合模式和结合亲和力。接着,通过分子动力学模拟进一步评估这些分子与受体的结合稳定性和动态行为。最后,我们进行MM/PBSA结合自由能计算,以定量评估分子与受体的结合能力。通过这一系列筛选步骤,我们逐步缩小候选分子的范围,最终筛选出10个具有较高结合亲和力和稳定性的分子。这些分子的化学结构具有一定的多样性,并且在合成可及性方面表现良好,为后续实验验证和优化提供了良好的基础。

### 实验验证与活性评估

为了进一步验证这些候选分子的生物活性,我们采用了NanoBRET技术进行功能实验。NanoBRET是一种高灵敏度的生物发光共振能量转移(BRET)方法,通过使用NanoLuc荧光素酶(Nluc)作为供体和荧光受体,研究蛋白质-蛋白质相互作用或分子接近性。我们使用β?AR-miniGs系统,评估了候选分子对受体激活能力的影响。结果显示,三个候选分子(alpha-β?-007、alpha-β?-008和alpha-β?-009)表现出显著的净BRET信号,表明它们能够高效激活β?AR。此外,通过使用β?AR拮抗剂propranolol进行反向实验,进一步验证了这些分子的活性确实是通过β?AR介导的。这些实验结果不仅确认了候选分子的活性,还为其进一步开发提供了坚实的基础。

### 活性定量与药代动力学评估

为了更精确地评估这些分子的活性,我们进行了剂量-反应实验,以确定其EC??值。结果显示,fenoterol(正对照)的EC??值为196 nM,而三个候选分子表现出显著的活性,其中alpha-β?-008的EC??值仅为0.19 nM,显示出极高的激动能力。此外,我们还使用SwissADME软件对这三个分子进行了初步的生物利用度预测,结果显示其预测的生物利用度为0.55,表明这些分子在体内的吸收能力良好,可能能够有效发挥药理作用。同时,我们还利用DataWarrior软件预测了这些分子的致突变性、致癌性和刺激性,结果表明它们的致突变性、致癌性和刺激性均显示为“无”,表明这些分子在安全性方面具有良好的表现。

### 新型激动剂的结构分析

为了进一步了解这些新型激动剂的结构特性,我们对它们进行了结构聚类分析。通过使用ClusterMaker2插件和ChemViz2插件在Cytoscape中进行聚类分析,我们发现这些新型分子在结构上与之前报道的高活性β?AR配体存在显著差异,且未出现在训练数据集中。这一结果表明,这些分子可能具有新的作用机制或药理功能,这有助于避免当前药物可能带来的副作用,并带来额外的生物益处。此外,通过PLIP工具进行的结合相互作用分析显示,这些新型分子与β?AR的关键氨基酸残基(如D113、F193、S203、S207、N293和N312)形成稳定的相互作用,如盐桥、氢键和π-π堆积等。这些相互作用不仅增强了它们的结合能力,还可能影响它们的药理活性和选择性。

### 方法学与模型优化

在本研究中,我们对分子描述符进行了筛选和优化,以提高机器学习模型的性能。首先,我们从Binding Database、ChEMBL、PubChem和ZINC数据库中收集了所有分子的活性数据,并进行了数据清洗,包括去除重复分子、缺乏活性数据的分子以及化学结构不合理的分子。清洗后的数据集包含1386个具有EC??活性数据的分子,为后续研究提供了高质量的数据基础。随后,我们生成了四种分子描述符:Morgan指纹、MACCS指纹、RDK指纹和PaDEL描述符,并通过计算它们之间的相关性,去除了高度相关的描述符,以减少多重共线性对模型性能的影响。最终,我们保留了26、34、26和29个特征,分别用于Morgan指纹、MACCS指纹、RDK指纹和PaDEL描述符。这些描述符在模型训练和评估中表现出良好的稳定性。

在模型构建过程中,我们采用了多种机器学习算法,并对它们的超参数进行了优化。通过5折交叉验证,我们确定了每个模型的最优超参数组合。例如,SVM_Morgan指纹模型的最优参数包括“C”为2.8,“gamma”为“scale”,“kernel”为“rbf”,“shrinking”为True,“tol”为0.001;RF_RDK指纹模型的最优参数包括“max_depth”为10,“max_features”为“sqrt”,“min_samples_leaf”为1,“min_samples_split”为3,“n_estimators”为240;XGBoost_PaDEL模型的最优参数包括“colsample_bytree”为0.7,“learning_rate”为0.05,“max_depth”为6,“n_estimators”为75,“subsample”为0.89。这些参数的优化使得模型在训练和测试数据集上均表现出良好的性能,如高准确率、高精确率和高召回率。

此外,我们还采用了一种基于分子结构相似性的聚类方法,以进一步分析候选分子的结构特征。通过构建分子相似性网络并应用Community Clustering(GLay)算法,我们成功地将候选分子分组,并发现它们在结构上与已知的高活性β?AR激动剂存在显著差异。这种结构多样性不仅有助于避免专利冲突,还可能带来新的药理作用,为未来的药物开发提供更多的可能性。

### 未来展望

本研究的成功不仅在于发现了三个具有高活性的β?AR激动剂,还在于其采用的机器学习与计算方法的结合,为未来的药物开发提供了新的思路。通过系统的筛选流程,我们能够在大规模化合物库中高效识别出具有药理活性的分子,同时确保其结构多样性与安全性。这种综合方法不仅提高了药物筛选的效率,还为药物研发提供了更加可靠和可扩展的框架。随着计算化学和人工智能技术的不断发展,类似的策略有望应用于其他GPCR靶点,从而推动更多新型药物的发现与开发。此外,这些新型激动剂的结构特征和作用机制为理解GPCR的结构-功能关系提供了新的视角,有助于开发更具选择性和安全性的药物。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号