基于配体与结构预测模型整合的UGT介导II相代谢反应计算策略研究

《Journal of Cheminformatics》:Prediction of UGT-mediated phase II metabolism via ligand- and structure-based predictive models

【字体: 时间:2025年10月17日 来源:Journal of Cheminformatics 5.7

编辑推荐:

  本研究针对UGT介导的II相代谢预测难题,开发了融合机器学习和分子模拟的创新计算框架。研究人员通过整合AlphaFold结构建模、分子对接与随机森林算法,构建了UGT2B7/2B15代谢预测模型,首次实现配体描述符与结构指纹的共识分析。结果表明联合策略显著提升预测精度(MCC>0.5),证实AlphaFold结构在代谢研究中的可靠性,为早期药物安全性评价提供了新范式。

  
药物代谢预测正成为药物发现早期阶段的关键技术,它能通过计算手段大规模评估候选化合物的稳定性和安全性。然而现有预测模型主要依赖配体属性(LB),缺乏对酶与底物识别机制的结构化洞察。尤其对于尿苷二磷酸葡萄糖醛酸转移酶(UGT)介导的II相代谢反应,由于人类UGT蛋白结构解析困难,迄今缺乏有效的结构基础(SB)预测模型。随着AlphaFold革命性蛋白结构预测技术的出现,终于为破解这一难题提供了契机。
本研究聚焦于临床重要的UGT2B7和UGT2B15同工酶,它们参与众多药物的清除过程并与药物相互作用(DDI)密切相关。研究人员通过整合多维计算技术,首次构建了融合配体与结构信息的机器学习预测模型,相关成果发表于《Journal of Cheminformatics》。
关键技术方法包括:从MetaQSAR数据库获取经人工校验的代谢数据集(373个底物/361个非底物);采用AlphaFold预测的UGT2B7(AF-P16662-F1)和UGT2B15(AF-P54855-F1)结构;通过分子动力学(MD)模拟分析辅因子UDPGA与底物的结合机制;利用PLANTS进行分子对接并提取Rescore+评分函数和PLEC相互作用指纹;采用随机森林(RF)算法构建分类模型,并通过共识策略整合LB与SB预测结果。
Structural insights about cofactor and substrate recognition by UGT2B7 and UGT2B15
通过250ns分子动力学模拟发现,辅因子UDPGA优先结合于酶活性口袋(E-C复合物),其结合模式与植物糖基转移酶2C1Z晶体结构一致。聚类分析显示UGT2B7与(R)-denopamine(DNP)结合时,底物的酚羟基与催化残基H3535形成氢键;UGT2B15与(S)-4-hydroxyphenytoin(p-HPPH)结合时,苯酚环朝向H3535定位。结合自由能计算(MM-GBSA)证实先结合辅因子的三元复合物具有更低能量(ΔG值降低),为后续对接研究提供最优蛋白构象。
Chemical space analysis
主成分分析(PCA)基于26种物理化学描述符显示,底物与非底物样本在化学空间分布高度重叠(图3),证明负样本集包含可能发生葡萄糖醛酸化的官能团,有效避免模型偏差。训练集与测试集分布均匀,保障模型验证可靠性。
Classification models for the prediction of UGT2B7 and UGT2B15 mediated metabolism
LB模型(基于物理化学描述符)在测试集表现最佳(UGT2B7 MCC=0.52;UGT2B15 MCC=0.45)。SB模型中PLEC指纹模型(UGT2B15 MCC=0.43)与Rescore+评分模型(UGT2B7 MCC=0.41)显示良好判别能力。共识策略将三类模型预测集成后,准确率显著提升(表4),证明LB与SB方法提供互补信息。
Structural similarity analysis and applicability domain evaluation
基于ECFP4指纹的Tanimoto相似性(TS)分析表明,SB模型的适用域(AD)受训练集结构相似性影响较小(图4),而LB模型精度与TS高度相关。对接姿态分析成功预测吉非罗齐(gemfibrozil)羧基、氯霉素(chloramphenicol)伯醇基、(S-奥沙西泮((S)-oxazepam)羟基和(R-柚皮素((R)-naringenin)7-羟基为反应位点,与实验数据一致。
本研究开创性地将AlphaFold结构模型应用于代谢预测领域,证实了理论蛋白结构在SB建模中的可靠性。通过整合LB描述符与SB对接信息,构建的共识模型显著提升预测性能,为解决II相代谢预测难题提供了新范式。该策略可扩展至其他未解析结构的代谢酶研究,为早期药物发现中的药代动力学评估提供强大计算工具。研究同时揭示辅因子优先结合机制,为理解UGT催化过程提供关键结构见解。尽管当前模型未考虑蛋白诱导拟合效应,但已为后续柔性对接研究奠定坚实基础。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号