
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的抗疟疾药物预测模型开发与实验验证
【字体: 大 中 小 】 时间:2025年02月10日 来源:BMC Chemistry 4.3
编辑推荐:
本研究针对疟原虫耐药性问题,开发了基于随机森林(RF)算法的抗疟疾活性预测模型RF-1。研究人员利用ChEMBL数据库中15,000余个经多剂量测试的化合物构建模型,通过KNIME平台优化获得91.7%预测准确率,并实验验证发现两种临床阶段激酶抑制剂具有微摩尔级抗疟活性。该研究为抗疟药物发现提供了高效计算工具,相关成果发表于《BMC Chemistry》。
疟疾作为由疟原虫(Plasmodium)引起的致命传染病,每年造成全球约2.49亿感染病例和60.9万死亡病例。尽管已有两种儿童预防疫苗,但疟原虫对所有临床药物产生耐药性,特别是青蒿素联合疗法(ACTs)治疗失败案例的不断增加,使得开发新型抗疟药物迫在眉睫。传统高通量筛选(HTS)方法成本高昂且存在假阳性问题,而既往机器学习(ML)模型多基于单剂量HTS数据,预测可靠性有限。
印度理工学院比拉尼分校(Department of Pharmacy, Birla Institute of Technology and Science Pilani)的研究团队在《BMC Chemistry》发表了一项突破性研究。他们利用ChEMBL数据库中15,118个经多剂量测试的抗疟化合物,开发出基于随机森林(RF)算法的预测模型RF-1。该模型采用Avalon分子指纹(MFP),通过KNIME平台优化后,在外部测试集上展现出91.7%的准确率和97.3%的AUROC值。实验验证发现两种临床阶段人类激酶抑制剂CEP-37440和AZD-1480具有微摩尔级抗疟活性,其中CEP-37440还能有效抑制β-血红素(β-hematin)形成。
研究采用三大关键技术方法:(1)从ChEMBL数据库筛选15,118个经IC50/EC50验证的化合物构建数据集;(2)使用KNIME平台开发工作流,比较9种分子指纹后选择Avalon MFP构建RF模型;(3)通过SYBR Green I法和β-血红素抑制实验(BHIA)验证预测结果。
研究结果部分显示:
数据筛选与预处理:从ChEMBL中筛选IC50≤200 nM的"活性"和IC50≥5000 nM的"非活性"化合物,按8:2比例分为训练集和测试集。
模型开发与优化:RF-1模型在150棵树和50层深度时达到最优性能,优于其他8种指纹模型。
模型验证:通过袋外(OOB)误差分析、10折交叉验证和Y随机化验证模型可靠性,APD分析显示99.6%测试分子在适用域内。
与MAIP平台比较:RF-1与现有MAIP模型预测结果互补,但均能识别符合抗疟特性空间的分子。
实验验证:从3,308个临床阶段化合物中筛选出CEP-37440(IC50 1.22 μM)和AZD-1480(IC50 4.00 μM)两个活性分子,其中CEP-37440显示强β-血红素抑制活性(IC50 14.2 μM)。
研究结论表明,RF-1模型是首个基于多剂量测试数据构建的高精度抗疟活性预测工具。其创新性体现在:(1)采用IC50值而非单剂量HTS数据,提高预测可靠性;(2)开源KNIME工作流使无编程背景研究者也能应用;(3)发现2,4-二氨基-5-氯嘧啶骨架可作为抗疟药物开发新起点。特别值得注意的是,CEP-37440的双重作用机制(抑制疟原虫激酶和β-血红素形成)为开发抗耐药药物提供了新思路。该研究不仅提供了高效的虚拟筛选工具,还通过实验验证拓展了抗疟药物的化学空间,对解决全球疟疾耐药危机具有重要意义。
生物通微信公众号
知名企业招聘