编辑推荐:
COVID-19 疫情下有效药物匮乏,药物再利用至关重要。研究人员结合分子对接与机器学习,针对 SARS-CoV-2 的 3CLpro筛选 5903 种获批药物,构建 QSAR 模型。发现 DTR 模型表现最佳,筛选出 6 种高亲和力药物,为新冠治疗提供新方向。
COVID-19 疫情自爆发以来,已成为全球公共卫生领域的重大挑战。截至 2024 年 6 月 6 日,全球累计确诊病例超 7.0475 亿例,死亡人数超 701 万。然而,目前仍缺乏特效治疗药物,传统新药研发周期长、成本高,难以满足紧急需求。在此背景下,药物再利用(即重新挖掘已获批药物的新适应症)因其能缩短研发时间、降低成本,成为应对突发传染病的重要策略。SARS-CoV-2 的 3CL 蛋白酶(3CLpro)是病毒复制的关键酶,其结构高度保守且无人类同源蛋白,是理想的药物靶点。但如何高效筛选出对 3CLpro具有高抑制活性的药物,仍是亟待解决的问题。
巴基斯坦工程与应用科学研究所的研究人员开展了一项旨在通过分子对接和机器学习方法筛选靶向 3CLpro的再利用药物研究。该研究成果发表在《Scientific Reports》上,为 COVID-19 治疗提供了新的候选药物和方法学参考。
研究人员主要采用了以下关键技术方法:首先,从 Zinc 数据库提取 5903 种世界获批药物(包括 FDA 批准药物),通过 OpenBabel 软件将药物的 SMILES 格式转换为 PDBQT 格式,完成数据预处理。其次,利用 AutoDock Vina 软件对药物与 3CLpro(PDB ID:7JSU)进行分子对接,计算结合亲和力,筛选出具有潜在活性的药物。最后,运用决策树回归(DTR)、Extra Trees 回归(ETR)等多种机器学习算法构建 QSAR 模型,通过 12 种分子指纹特征(如 CDK、MACCS 指纹)预测药物结合亲和力,并对模型性能进行评估。
研究结果
QSAR 模型性能评估
通过 12 种分子指纹特征对 DTR 模型进行评估,结果显示 CDK 和 MACCS 指纹表现最佳,R2均达 0.97,RMSE 分别为 1.68 和 1.57,且 Q2与 R2差值较小,表明模型拟合度和预测能力良好。与其他机器学习模型(如 ETR、KNNR)相比,DTR 模型在 CDK 和 MACCS 指纹特征下的 R2最高,证实其在预测结合亲和力方面的优越性。
分子对接结果
对筛选出的药物进行分子对接分析,发现 6 种高亲和力药物(Zinc ID:3873365、85432544、203757351、85536956、8214470、261494640)的结合亲和力在 - 15 kcal/mol 至 - 13 kcal/mol 之间。其中,ZINC003873365(Stanozolol)与 3CLpro的结合亲和力最低(-15.1 kcal/mol),通过氢键和疏水作用与 His163、Glu166 等关键氨基酸残基结合,显示出强相互作用。
药物理化性质分析
对 6 种候选药物的理化性质进行评估,包括分子量、logP、氢键供体 / 受体数量等。结果显示,这些药物的分子量在 328.5-900.1 g/mol 之间,logP 值为 2.732-5.527,均符合药物 - like 特性。较高的 sp3杂化碳比例(0.42-0.90)表明其具有良好的三维结构复杂性,有利于与靶点结合。
研究结论与讨论
本研究成功建立了分子对接与机器学习相结合的药物再利用框架,通过靶向 3CLpro筛选出 6 种高潜力候选药物。DTR 模型在预测药物结合亲和力方面表现优异,为后续药物筛选提供了高效的计算方法。候选药物如 Paritaprevir(丙肝蛋白酶抑制剂)已在临床中显示安全性,其再利用可能加速 COVID-19 治疗药物的开发进程。
然而,研究仍存在一定局限性。例如,计算模型未完全考虑蛋白质动态构象变化、药代动力学及脱靶效应等因素,需进一步通过体外和体内实验验证候选药物的有效性和安全性。尽管如此,该研究为 COVID-19 治疗提供了新的候选药物和方法论启示,尤其在全球资源有限的背景下,药物再利用策略有望缩短研发周期,为应对突发公共卫生事件提供重要支持。未来研究可结合分子动力学模拟和临床前试验,进一步推进候选药物的转化应用。