
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习和分子模拟的药物重定位策略:发现新型HDAC3抑制剂治疗乳腺癌
【字体: 大 中 小 】 时间:2025年06月20日 来源:Aspects of Molecular Medicine CS1.1
编辑推荐:
本研究针对乳腺癌治疗中组蛋白去乙酰化酶3(HDAC3)过度表达的关键问题,通过机器学习虚拟筛选结合分子对接和动力学模拟技术,从4288种已批准药物中鉴定出5种潜在HDAC3抑制剂(如ZINC000095618609,对接得分-10.96 kcal/mol)。研究创新性地采用RDKit指纹构建随机森林分类模型,结合MMGBSA结合自由能计算和100 ns分子动力学模拟验证稳定性,为缩短抗癌药物研发周期提供了高效计算策略,成果发表于《Aspects of Molecular Medicine》。
在癌症治疗领域,组蛋白去乙酰化酶3(HDAC3)的过度表达如同一个失控的"基因开关",与乳腺癌的发生发展密切相关。这种表观遗传调控酶通过移除组蛋白上的乙酰基团,导致染色质紧缩和抑癌基因沉默,进而促进肿瘤细胞增殖和转移。尽管天然来源的HDAC3抑制剂不断被发现,但传统药物研发耗时长达15年且成本高昂,使得急需寻找更高效的开发策略。
针对这一挑战,研究人员开展了一项创新性研究,将人工智能与计算生物学相结合。研究团队首先从ChEMBL数据库获取576个HDAC3抑制剂构建机器学习模型,采用RDKit生成的210个分子描述符,通过随机森林分类器(RandomForestClassifier)将ZINC15数据库中的4288种已批准药物分为强/弱抑制剂两类。在结构生物学层面,研究采用三级精度对接策略(HTVS→SP→XP)筛选化合物,结合分子力学广义波恩表面积(MMGBSA)计算结合自由能,并对最优复合物进行100纳秒分子动力学(MD)模拟验证。
化学空间探索与机器学习分类
通过分析NumHDonors、RingCount等关键分子描述符,建立的分类模型AUC达0.83,成功筛选出2549个潜在强效抑制剂。特征重要性分析显示拓扑极性表面积(TPSA)和SlogP_VSA2等参数对HDAC3抑制活性预测最具贡献。
分子对接与MMGBSA分析
采用Glide软件的三级对接策略发现,化合物ZINC000095618609以-10.96 kcal/mol的对接得分显著优于参考配体BG45(-4.18 kcal/mol)。MMGBSA计算揭示其结合自由能达-44.46 kcal/mol,关键相互作用包括与LYS49、GLN52的持久氢键(持续90-100%模拟时间)以及与PHE200的疏水作用。
ADMET性质预测
虽然多数先导化合物存在分子量>500 Da导致低胃肠道吸收的问题,但所有化合物均符合Lipinski五规则(RO5≤3),且无CYP450抑制风险。值得注意的是,先导化合物ZINC000095618609(克拉屈滨三磷酸)作为已知抗白血病药物,展现了良好的安全性特征。
分子动力学模拟验证
100 ns模拟显示HDAC3-ZINC000095618609复合物RMSD稳定在6.0?,显著优于参考配体复合物(>9?)。关键残基ARG265和GLN52通过水桥作用维持了80%以上的接触时间,而疏水口袋PHE199-PHE200的构象变化解释了其特异性结合机制。
这项研究的重要意义在于建立了从计算预测到动力学验证的多层次药物重定位平台。特别值得注意的是,发现的先导化合物ZINC000095618609作为已获批的化疗药物,其抗乳腺癌新用途的开发可大幅缩短临床转化周期。研究不仅为HDAC3抑制剂的快速发现提供了ML-MD协同筛选范式,更揭示了嘌呤类似物作为表观遗传调控剂的新机制。未来研究需通过体外实验验证这些计算预测,并优化先导化合物的溶解性和生物利用度,以加速其临床转化应用。
生物通微信公众号
知名企业招聘