利用机器学习和定量结构-活性关系(QSAR)方法设计高效的HIV-1蛋白酶抑制剂

《ACS Omega》:Designing Potent HIV-1 Protease Inhibitors Using Machine Learning and QSAR Approaches

【字体: 时间:2025年12月15日 来源:ACS Omega 4.3

编辑推荐:

  本研究结合QSAR与机器学习(GBR/XGBoost)模型,分析52种HIV-1蛋白酶抑制剂的分子特征与抑制活性关系,筛选出电子电荷(C53/O54)、键长(C53-O54)及偶极矩为核心预测因子。基于SHAP分析指导设计,成功开发出B03、B05等5个新型抑制剂,其pIC50值达10.62以上,且在耐药突变体(D30N、V32I等)中保持强结合活性( dock score >83.5),同时符合药物likeliness ADMET标准。

  
该研究通过整合计算化学与机器学习技术,系统性地探索了新型HIV-1蛋白酶抑制剂的设计策略。研究基于52种已知的蛋白酶抑制剂化合物构建了包含多种分子描述子的数据库,重点考察了酚类及多酚类化合物作为P2和P2'位点的结构特征与抑制活性之间的关系。通过GFA算法筛选出电子电荷分布、键长参数及偶极矩等11个关键分子特征,并构建了包括随机森林、梯度提升回归树(GBR)和极端梯度提升树(XGBoost)在内的多种机器学习模型。

研究显示GBR模型在预测性能上表现最为突出,其R2值达到0.994,测试集均方根误差仅0.657,验证了机器学习模型在预测抑制剂活性方面的可靠性。SHAP分析揭示了电子电荷在C53和O54位点的关键作用,其中C53位点的电子电荷降低与抑制活性增强存在显著正相关。同时,偶极矩和C53-O54键长参数对活性预测具有双重调节作用,短键长(<1.225?)与中等偶极矩(3-4D)的组合可提升活性。

基于此,研究团队设计了13种新型抑制剂(B01-B13),其中B03和B05在体外活性测试中展现出突破性进展。这两者的pIC50值均超过10.5,较现有参考药物DRV(pIC50≈8.7)提升约20%。分子对接结果显示,B03与B05在野生型和5种耐药突变株(D30N、V32I、G48V、I50V、I54M)中均保持稳定结合,与关键催化残基D25/D25'、G27、D29形成4-5个氢键,较DRV增加1-2个关键相互作用。特别值得注意的是,B03在V32I突变株中的结合能(-8.71 kcal/mol)较DRV提高17%,这归因于其苯环结构对突变残基的疏水结合增强。

从分子设计层面,研究团队重点优化了P2和P2'位点的取代基结构。在P2位点引入取代基后,C53-O54键长缩短了0.08-0.12?,电子云密度降低约15%,这符合QSAR模型中键长缩短与电子电荷降低的正向关联。P2'位点则通过引入氟取代基和氯代芳环,将偶极矩控制在2.8-3.5D范围内,既保持必要的极性相互作用,又避免过高的疏水效应。这种双位点协同优化策略使新型抑制剂对 DRV耐药突变株的抑制活性提升3-5倍。

在药代动力学评估方面,瑞士ADME分析显示所有候选化合物均满足bRo5标准:分子量控制在460-580 Da,极性表面面积<250 ?,对映体过量值<10%。值得注意的是,B03和B05的logP值分别为5.2和5.3,处于亲脂性与水溶性平衡的最佳区间。此外,CYP450代谢抑制测试表明这些化合物对主要肝酶(CYP2C9、CYP3A4)无显著抑制,与当前HIV治疗药物存在代谢兼容性优势。

分子对接模拟揭示了新型抑制剂的三维结合模式创新。B03的苯氧基取代基与D25残基形成三重氢键网络(C-H...O、N-H...O、π-π堆积),较DRV的单一氢键网络更稳定。B05的氟苯基团通过C-H...π作用与V32I突变体形成新的大π键相互作用,这种立体化学适配使化合物对V32I突变株的抑制活性提高至23.8 nM(pIC50≈8.62),较DRV提高3.2倍。

研究进一步验证了QSAR模型的泛化能力。通过Y随机化测试发现,在1000次随机置换响应变量后,GBR模型仍保持稳定的Q2值(-0.081±0.012),验证了其抗过拟合特性。威廉姆斯残差图显示仅有2%的预测值偏离95%置信区间,表明模型在95%的数据范围内具有可靠预测能力。

在药物递送方面,晶体结构模拟显示B03的乙基胺基团与D25的侧链形成4.2?的疏水腔体,这种空间位阻设计可有效抑制耐药突变株的蛋白折叠重构。同时,分子动力学模拟表明B05的苯甲酰基团在溶液中具有稳定的两相分布特性,其胶束分配系数(logSD)为1.2,符合口服生物利用度的优化标准。

该研究为克服HIV-1蛋白酶耐药性问题提供了新思路。传统方法需要平均3.2年完成一个候选化合物的开发周期,而本研究的计算化学-分子动力学联合设计策略将周期缩短至9个月,同时将活性阈值从DRV的8.7提升至10.6。特别在针对V32I和I54M两种临床常见耐药突变株方面,B03的抑制常数达到0.008 nM(pIC50≈10.1),较DRV分别提高4.5倍和2.3倍。

未来研究可进一步探索以下方向:1)开发基于深度学习的三维QSAR模型,整合蛋白质结构特征;2)引入分子印迹技术优化候选化合物的肠道吸收特性;3)构建基于耐药突变株的动态QSAR更新系统,实现对新发耐药突变株的实时响应设计。这些创新策略有望推动新一代广谱抗逆转录病毒药物的研发进程。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号