PDL1-inhi.Predictor:一个用于预测和优先排序PDL1抑制剂的双层机器学习框架
《Bioorganic Chemistry》:PDL1-inhi.Predictor: a two-tiered machine learning framework for predicting and prioritizing PDL1 inhibitors
【字体:
大
中
小
】
时间:2025年11月03日
来源:Bioorganic Chemistry 4.7
编辑推荐:
本研究利用机器学习模型筛选PD-L1小分子抑制剂,结合分子对接和动力学模拟验证活性,发现2个高亲和力候选化合物(IC50≤17.49 nM),并识别15个关键结构基团,开发了在线预测工具PDL1-inhi.predictor,提升抑制剂发现效率。
在当今癌症治疗领域,免疫检查点抑制剂已成为一种革命性的疗法,尤其是针对PD-1/PDL1通路的干预。这一通路在调节T细胞活性中发挥着重要作用,其抑制机制在多种恶性肿瘤中被广泛利用。然而,尽管抗体药物在临床上取得了显著成效,其高成本、较差的组织渗透性以及需要静脉注射等局限性,促使研究者们转向开发小分子药物作为替代方案。小分子药物具有良好的口服生物利用度和易于大规模生产的特性,因此在癌症治疗中展现出广阔的应用前景。然而,PD-1/PDL1靶点的复杂性,如其广泛的相互作用界面和缺乏明确的可药化口袋,使得小分子抑制剂的发现变得极具挑战。
为了应对这一难题,研究团队提出了一种基于机器学习的综合策略,旨在通过预测小分子对PD-L1的活性和结合亲和力,加速高效抑制剂的筛选过程。该研究的核心目标是通过机器学习模型的优化,提高小分子药物筛选的准确性和效率,从而为PD-L1抑制剂的开发提供有力支持。研究者们构建了多个分类和回归模型,并通过系统的评估,最终确定了Stacking_standard作为最优的分类器,以及SVM_standard作为最佳的回归器。这种双重模型的结合,使得研究团队能够采用一种分层的筛选策略,从而在活性预测和结合亲和力评估之间实现更精确的平衡。
在模型构建过程中,研究者们首先对来自ChEMBL和PubChem数据库的分子活性数据进行了深入挖掘。为了确保数据的一致性和有效性,研究团队采用了基于相似性的去重策略,剔除了结构高度相似或重复的分子,以避免模型训练过程中出现数据泄漏问题。数据泄漏是机器学习模型训练中的一个常见挑战,它可能导致模型在测试集上的表现被人为夸大,从而影响其泛化能力。通过采用基于Bemis-Murcko骨架的划分方法,研究者们能够将具有相同核心骨架的分子归入同一子集,从而有效减少数据冗余并提高模型的可靠性。
研究团队构建的模型不仅限于预测分子的活性,还能够评估其与PD-L1的结合亲和力。这一功能对于小分子药物的开发至关重要,因为结合亲和力直接决定了药物在体内的作用效果。通过结合分类器和回归器的预测能力,研究团队得以在大规模化合物库中高效筛选出潜在的PD-L1抑制剂。最终,从1200万种化合物中筛选出6704种可能的候选分子,并通过分子对接技术进一步优化和验证这些分子的结合能力。在这些候选分子中,有七种表现出强烈的结合亲和力,其结合能量低于或等于-11.5 kcal/mol。通过HTRF(均相时间分辨荧光共振能量转移)实验,研究团队确认了其中两种化合物对PD-L1具有显著的抑制作用,其IC50值分别为17.49 nM和63.17 nM,表明这些化合物在抑制PD-L1方面具有较高的效力。
为了进一步验证这些候选分子的结合稳定性,研究团队进行了300纳秒的分子动力学模拟。分子动力学模拟是一种强大的计算工具,能够模拟分子在不同时间尺度下的动态行为,从而揭示其与靶点之间的相互作用机制。通过这些模拟,研究者们观察到这些抑制剂能够保持稳定的结合构象,说明它们在体内可能具有较长的结合时间,从而增强其治疗效果。此外,研究团队还通过SwissADME平台对这些化合物进行了药理特性分析,发现它们具有良好的药物样特性,尤其是Hit 1,其分子特性符合理想的药物标准,这为其作为先导化合物的进一步开发提供了坚实的基础。
除了验证潜在的抑制剂,研究团队还进行了一项关键的结构分析,识别出15种重要的亚结构基序。这些基序对于PD-L1的结合具有决定性作用,它们的识别不仅有助于理解小分子抑制剂的结合机制,还为后续的药物设计提供了重要的理论依据。通过分析这些结构特征,研究者们能够更加理性地设计新的抑制剂,从而提高其靶向性和活性。这些基序的发现,标志着在小分子药物设计领域迈出了重要的一步,为未来的药物开发提供了新的方向。
研究团队还开发了一个名为PDL1-inhi.predictor的在线平台,该平台基于其构建的机器学习模型,允许研究人员直接使用这一计算框架进行PD-L1抑制剂的筛选和验证。这一平台的建立,极大地提高了药物发现的效率,使得研究人员能够更快地获得高潜力的化合物信息。此外,PDL1-inhi.predictor的开放性设计,使得全球的研究者可以共享这一资源,从而推动整个领域的快速发展。
值得注意的是,研究团队在方法论上进行了多项创新,特别是在模型选择和数据处理方面。通过系统地评估30种分类器和30种回归器,研究者们能够找到最适合当前任务的模型,这不仅提高了预测的准确性,还增强了模型的泛化能力。此外,采用基于骨架的划分策略,有效避免了数据泄漏问题,确保了模型在不同化合物集上的适用性。这些方法的结合,使得研究团队能够在保证模型性能的同时,提高筛选过程的效率和可靠性。
从研究结果来看,这一基于机器学习的筛选策略在多个方面展现了其优势。首先,它能够在短时间内处理大量的化合物数据,显著缩短了传统实验筛选所需的时间。其次,通过结合分子对接和分子动力学模拟,研究团队不仅能够预测分子的活性,还能够深入了解其与PD-L1的结合机制,从而为后续的实验研究提供指导。此外,该策略还能够识别出关键的结构特征,为药物设计提供理论支持,使得研究人员能够在设计阶段就考虑到分子的结合特性,从而提高药物的成功率。
然而,尽管这一策略在小分子药物筛选方面表现出色,仍然存在一些挑战和改进空间。例如,如何进一步提高模型的预测精度,特别是在处理具有复杂结构的化合物时,仍然是一个需要解决的问题。此外,虽然研究团队已经确认了部分候选分子的活性,但这些分子的临床转化仍需更多的实验验证和优化。未来的研究可以进一步探索如何将这些模型应用于其他免疫检查点靶点,从而拓展其应用范围。同时,研究团队还可以结合更多的实验数据,不断优化模型的参数和结构,以提高其在不同化合物集上的适用性。
总的来说,这项研究为小分子PD-L1抑制剂的发现提供了一种高效、可靠且可扩展的计算策略。通过整合机器学习、分子对接和分子动力学模拟等多种技术手段,研究团队不仅成功筛选出具有高活性和良好结合亲和力的化合物,还揭示了关键的结构特征,为后续的药物设计和开发提供了重要的理论依据。此外,PDL1-inhi.predictor平台的建立,使得这一计算框架能够被更广泛地应用于癌症治疗领域,推动免疫疗法的进一步发展。未来,随着更多实验数据的积累和计算技术的不断进步,这一策略有望在小分子药物发现领域发挥更大的作用,为癌症患者带来更多希望。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号