在LLM辅助建模的指导下,通过计算机模拟方法筛选出一种具有较低心脏毒性的多柔比星替代药物

《Journal of Molecular Graphics and Modelling》:In-Silico Identification of a Doxorubicin Alternative with Reduced Cardiotoxicity Informed by LLM-Assisted Modeling

【字体: 时间:2025年11月10日 来源:Journal of Molecular Graphics and Modelling 3

编辑推荐:

  多柔比星衍生物通过整合分子对接、动力学模拟和大型语言模型预测ADME/ADMET特性,显著提升药代动力学和安全性。Ligand-2对UGT1A9亲和力达-11.4 kcal/mol,与拓扑异构酶IIβ作用微弱,MD验证稳定性,LLM模型R2达0.84(清除)和>0.89(BBB/吸收),hERG抑制准确率92%,SHAP分析揭示关键分子描述符。

  在癌症治疗领域,蒽环类抗生素如多柔比星(doxorubicin)因其广泛的抗肿瘤活性而被广泛使用。然而,这类药物在临床应用中面临严重的副作用,尤其是心脏毒性以及清除率较低的问题。为了应对这些挑战,研究人员开发了一种综合性的计算流程,将分子对接、分子动力学模拟以及大型语言模型(LLM)相结合,用于预测药物的吸收、分布、代谢和排泄(ADME)特性,以及毒性(ADMET)风险。通过这一方法,研究人员评估了多个化合物,其中Ligand-2(CHEMBL1514139)显示出对UGT1A9的强结合能力(结合能为-11.4 kcal/mol),同时与拓扑异构酶IIβ的相互作用较弱。分子动力学模拟进一步验证了Ligand-2的结合稳定性,而基于LLM的回归模型预测了其良好的ADME特性,包括清除率的R2值为0.840,血脑屏障(BBB)穿透率和吸收率的R2值均超过0.89。此外,使用随机森林(RF)模型对hERG II抑制进行了分类,取得了92%的准确率和91%的R2评分。通过Shapley Additive Explanations(SHAP)分析,研究人员还能够识别影响药代动力学和毒性预测的关键分子特征。Ligand-2在药代动力学特性方面表现出与多柔比星相当或更优的表现,支持其作为更安全的蒽环类药物类似物的潜力。

多柔比星是一种自1960年代以来从链霉菌(Streptomyces peucetius)中分离出的蒽环类抗生素,因其广泛的抗肿瘤活性而成为癌症化疗的重要基石。多柔比星能够有效治疗乳腺癌、白血病和淋巴瘤等多种恶性肿瘤。其作用机制主要包括DNA插入、抑制拓扑异构酶II以及产生活性氧(ROS),最终导致快速增殖的癌细胞发生凋亡。然而,尽管多柔比星具有显著的治疗效果,其临床应用却受到累积剂量依赖性心脏毒性的限制,主要归因于其在心肌细胞中引起的氧化应激和线粒体功能障碍。这种毒性不仅限制了最大耐受剂量,还常常迫使治疗方案进行调整或终止。此外,多柔比星的药代动力学特性在个体间存在显著差异,这些差异受到其通过CYP1A2酶代谢和通过外排转运蛋白转运的影响,使得剂量调整变得复杂,并增加了不良反应的风险。

为了减少多柔比星的毒性,研究人员投入大量努力开发具有改进安全性的结构衍生物和替代制剂。例如,脂质体制剂如Doxil通过改变药物的分布和清除特性,实现了增强的肿瘤选择性和减少的心脏毒性。尽管取得了这些进展,优化蒽环类药物的药代动力学和代谢稳定性仍然是一个重大挑战。传统的结构-活性关系(SAR)方法和定量结构-活性关系(QSAR)模型虽然在改进多柔比星的毒性同时保留其抗癌活性方面提供了有价值的见解,但这些方法往往无法全面捕捉药物代谢、分布和毒性特性,因此需要整合更先进的计算技术。

近年来,机器学习(ML)在药物发现中崭露头角,尤其是在预测药代动力学和毒性特性方面。深度学习、图神经网络(GNN)以及大型语言模型(LLM)等技术的进步,显著提升了分子特性预测的能力。这些模型利用庞大的化学数据集,提取出超越人类定义的高维潜在表示。与传统ML方法依赖于预定义的分子指纹不同,基于LLM的模型能够推断复杂的化学关系,从而提高对药物吸收、分布、代谢和排泄(ADME)特性的预测能力。然而,尽管LLM在ADME回归任务中表现出强大的预测能力,其在预测药物毒性(ADMET)方面的应用仍受到可解释性挑战的限制。因此,监督学习模型仍然是ADMET分类的首选,能够明确识别毒性风险和脱靶相互作用。

在这一背景下,机器学习方法也被应用于蒽环类药物衍生物的优化,特别是多柔比星。图神经网络已被用于建模分子相互作用和预测ADME特性,显示出更高的准确性。基于SMILES的Transformer模型则在捕捉代谢途径和分子生物活性方面展现出潜力。强化学习技术还被用于蒽环类药物类似物的从头设计,使得生成具有更优治疗指数的候选分子成为可能。尽管取得了这些进展,这些策略往往独立于结构导向的筛选,限制了其根据生物验证的目标结合优先选择化合物的能力。相反,结构导向的流程,包括分子对接和动力学模拟,主要关注结合亲和力,而没有整合后续的药代动力学或毒性建模。这种方法上的脱节限制了识别能够同时平衡疗效、代谢稳定性和安全性的化合物的能力。尽管已经开发了如表柔比星(epirubicin)和柔红霉素(daunorubicin)等替代药物,通过改变立体化学或糖基团来减少心脏毒性,但很少有研究将基于配体的骨架设计、结构导向的筛选和ML驱动的ADME/ADMET预测整合在一个统一、迭代的框架中。因此,仍然需要一种全面的计算流程,能够识别具有优化药代动力学特性、减少脱靶风险和更优治疗指数的蒽环类药物衍生物。

本研究的目标是寻找一种能够改善药代动力学特性和减少心脏毒性的多柔比星替代品。为此,我们采用了一种多阶段的计算方法,首先使用传统的计算化学方法,随后整合机器学习技术以优化预测结果。我们系统地修改了多柔比星的骨架结构,生成了222个具有目标结构变化的化学多样性衍生物,旨在增强代谢稳定性和减少心脏毒性。随后,我们对201种人类来源的蛋白质进行了分子对接,以识别具有高亲和力相互作用的先导化合物,并通过分子动力学模拟评估了这些配体在生理条件下的稳定性。

在结构导向的筛选之后,我们应用了机器学习方法以优化药代动力学预测。我们采用了一种混合的机器学习框架,利用基于LLM的迁移学习进行ADME回归,同时采用监督学习模型进行ADMET毒性分类。这种方法使我们能够更深入地理解系统的清除率、潜在的代谢途径以及毒性风险。此外,我们的模型预测性能与先前报道的文献值进行了基准测试,以确保其可靠性和与现有计算方法的可比性。通过整合分子对接、分子动力学模拟和机器学习技术,本研究引入了一种新颖的、多阶段的计算框架,系统地优化了蒽环类药物衍生物的药物发现过程。与之前仅依赖于结构导向方法或机器学习的方法不同,我们的策略独特地结合了两者,确保在进行机器学习模型预测之前,结构导向的筛选过程能够捕捉到生物相关的相互作用。结构导向筛选与机器学习驱动的ADME/ADMET建模的结合,使得能够优先选择具有最佳治疗潜力的先导化合物。这种多方面的方法提高了药代动力学和毒性评估的预测准确性,有助于设计更安全的蒽环类药物替代品。此外,我们还整合了Shapley Additive Explanations(SHAP)分析作为解释框架,以量化个体分子特征对模型预测的贡献,从而增强预测结果的透明度和机制理解。

本研究的成果建立了一种新颖且可扩展的计算策略,整合了结构导向的药物设计和机器学习技术,以优化蒽环类药物的药代动力学特性和减少毒性。该多方面的方法包括分子对接以识别关键的配体-蛋白质相互作用,分子动力学模拟以验证结合稳定性,以及机器学习驱动的ADME/ADMET建模以优化药代动力学和毒性预测。通过整合这些方法,我们的框架为识别更安全、更有效的蒽环类药物衍生物提供了一个全面的流程。这种方法不仅推动了蒽环类药物家族中的先导优化,也为跨多类治疗领域的理性药物设计提供了一个广泛应用的范式。

为了更好地理解这一综合计算流程,图1展示了整合的工作流程,包括配体筛选、分子动力学优化和基于LLM的ADMET预测。这一流程系统地整合了结构导向和机器学习技术,以提升药物发现的效率和准确性。通过这一方法,研究人员能够更全面地评估药物的药代动力学特性,减少脱靶风险,并确保新药物的安全性。这种方法的引入为未来的药物研发提供了新的思路,特别是在处理复杂药物特性时,能够结合结构和机器学习的优势,从而实现更精准的预测和设计。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号