利用机器学习构建 QSAR 模型筛选 β- 内酰胺酶抑制剂的创新成果

【字体: 时间:2025年03月04日 来源:BMC Research Notes 2.8

编辑推荐:

  研究人员为解决 β- 内酰胺酶致耐药及分子对接局限性问题,构建基于机器学习的 QSAR 模型,助力抗菌药研发。

  在细菌耐药性问题日益严峻的当下,抗生素的效力正遭受巨大挑战。其中,β- 内酰胺酶(一种由细菌产生的酶)是导致抗生素耐药的 “罪魁祸首” 之一。它能够使 β- 内酰胺类抗生素(治疗感染常用的三大抗菌类药物之一)失去活性,从而让细菌对这类药物产生耐药性,这一问题在全球范围内都极为棘手。
在药物研发过程中,分子对接模拟技术虽能加快药物发现进程,但它存在一个明显的短板 —— 成功率较低。为了突破这一困境,来自德国 Friedrich-Alexander-Universit?t Erlangen-Nürnberg 大学生物系药物生物学部门以及中国科学院深圳先进技术研究院的研究人员展开了深入研究。他们的研究成果发表在《BMC Research Notes》上,为解决抗生素耐药问题带来了新的希望。

研究人员开展的主要研究工作涉及多个关键技术方法:

  1. 体外 β- 内酰胺酶抑制筛选:使用标准体外比色酶结合测定法,对 89 种来自 FARM - BIOMOL 化学库的生物分子进行检测,通过微板读数器监测光密度(OD)变化,进而计算出每种生物分子对 β- 内酰胺酶的抑制百分比、标准偏差(SD)和标准误差(SEM)。
  2. 分子对接模拟:运用 AutoDock Vina(AD Vina)、DOCK6 以及将两者结果结合的共识对接这三种方式进行分子对接模拟,预测化合物与 β- 内酰胺酶结合位点的结合分数。
  3. 机器学习结合 QSAR 模型构建:分析随机森林和逻辑分类这两种机器学习算法,每种算法生成 30 个模型,利用 PaDEL 软件生成 1875 个物理化学性质描述符,并将共识二元分数作为额外描述符,最终构建基于机器学习的定量构效关系(QSAR)模型。

研究结果如下:

  1. β- 内酰胺酶抑制筛选结果:在 Data file 1 中,详细记录了 89 种生物分子的抑制百分比、SD 和 SEM,以及它们的简化分子输入线输入系统(SMILE)数据,这些数据为后续研究提供了重要的实验依据。
  2. 对接模拟结果:Data file 2 至 4 分别展示了 AD Vina、DOCK6 以及共识对接的结果。AD Vina 和 DOCK6 的结果文件包含 89 种化合物的 3D 化学结构和预测结合分数等相关信息;共识对接则通过比较和识别前两者的结果,以 50% 百分位数为截止阈值,提供了二元分数和综合分数两种评分系统。
  3. 机器学习 - QSAR 模型结果:通过对随机森林和逻辑分类算法生成的模型进行分析,以最高准确率和受试者工作特征曲线下面积(ROCAUC)分数确定最佳模型。最终,研究人员成功构建了 60 个机器学习模型(随机森林和逻辑回归各 30 个)。

研究结论和讨论部分:
这项研究意义重大。首先,研究人员将实验数据公开分享,其中包含一些天然产物对 β- 内酰胺酶抑制作用的首次报道,这为全球抗耐药菌药物研发提供了宝贵的数据资源。其次,公开的优化对接协议和构建的机器学习模型,方便其他科研人员进一步开展相关研究,有助于推动基于机器学习的 QSAR 模型在药物研发领域的应用,为解决抗生素耐药问题提供了新的思路和方法。

不过,该研究也存在一定的局限性。例如,数据集规模相对较小,化学库中的化合物仅代表了天然产物类别的一小部分;在酶生物学方面,只测试了一种 β- 内酰胺酶(实际上共有四种) ;对接模拟仅使用了两种软件;在机器学习和 QSAR 模型构建时,使用的是开源程序生成的不太特异的物理化学性质描述符,且仅运用了一种机器学习算法(随机森林)。尽管如此,研究人员建立的概念验证模型表现出了可接受的性能,为后续研究奠定了基础。但在使用这些数据时,仍需谨慎评估,以避免不良结果。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号