利用Rosetta超大型库筛选鉴定LRRK2 WD重复域新型结合剂的CACHE挑战研究
【字体:
大
中
小
】
时间:2025年09月27日
来源:Journal of Cheminformatics 5.7
编辑推荐:
为解决帕金森病相关靶点LRRK2 WDR40域缺乏有效配体的难题,研究人员采用新型进化算法REvoLd对Enamine REAL空间进行超大型库筛选,成功鉴定出结合常数KD优于150μM的新型小分子抑制剂,实现了计算药物发现方法的首次前瞻性验证,为靶向WD40蛋白家族的药物开发提供了新范式。
在帕金森病(Parkinson's Disease, PD)的治疗靶点探索中,富含亮氨酸重复序列激酶2(Leucine-Rich Repeat Kinase 2, LRRK2)的色氨酸-天冬氨酸重复结构域40(WD40-repeat domain 40, WDR40)近年来备受关注。LRRK2基因突变是家族性帕金森病最常见的遗传病因,然而针对该靶点的研究却相对匮乏。传统药物研发面临化学空间巨大(可达1063个化合物)而实验筛选能力有限的矛盾,尽管Enamine等公司提供的"按需合成"化合物库(如REAL空间包含超过300亿种化合物)在一定程度上缓解了化合物可获得性问题,但如何高效探索如此庞大的化学空间仍是一个巨大挑战。
针对这一难题,Fabian Liessmann等研究人员在《Journal of Cheminformatics》上报道了他们参与的首届计算命中发现实验关键评估(Critical Assessment of Computational Hit-finding Experiments, CACHE)挑战赛的研究成果。CACHE挑战赛是受蛋白质结构预测关键评估(Critical Assessment of protein Structure Prediction, CASP)启发而设立的盲法基准测试平台,旨在比较和增强小分子命中发现算法。在第一届挑战中,参赛团队需要为LRRK2的WDR40结构域预测新型结合剂。
研究团队开发了一套完整的计算筛选流程,核心是使用新开发的进化算法RosettaEvolutionaryLigand(REvoLd)对Enamine REAL空间进行超大型库筛选(Ultra-Large Library Screening, ULLS)。与传统的暴力枚举方法不同,REvoLd利用组合化合物库的特性,通过进化算法探索化学空间,在考虑受体灵活性的同时高效筛选超大化合物库。
为开展这项研究,研究人员采用了几个关键技术方法:首先通过分子动力学(Molecular Dynamics, MD)模拟生成靶标结构的构象系综;利用RosettaLigand进行盲法对接识别结合位点;采用REvoLd进化算法对Enamine REAL空间进行组合化合物库优化;通过交通灯(Traffic Light, TL)评分方案和PAINS(Pan Assay Interference Compounds)过滤进行化合物筛选;最后通过表面等离子体共振(Surface Plasmon Resonance, SPR)等技术进行实验验证。所有计算基于Rosetta套件(版本2021.40-2022.45)和RDKit(版本2022.09.1)完成。
研究人员选择LRRK2全长结构(PDB ID: 7LHT)中的WDR40结构域作为主要模型,虽然其分辨率(3.5 ?)低于分离的WDR40结构域(PDB ID: 6DLO; 2.7 ?),但具有更完整的环区。通过分子动力学模拟探索了结合位点周围的局部构象空间,最终选择11个聚类中心作为代表性模型用于后续对接研究。
为全面探索中央空腔内的结合位点,研究人员进行了扩展采样,将配体放置允许范围扩大到包含整个空腔,并将生成的蛋白质-配体复合物数量从150个增加到200个。通过分析发现两个具有高频率配体结合相互作用的独特区域,这些区域被用作后续筛选的起始点。
用REvoLd进行虚拟筛选以识别有前景的化合物及后续过滤
研究人员使用从MD模拟得到的11个模型和先前确定的两个起始位置进行了多次ULLS运行。总共进行了198次REvoLd运行,生成358,713个分子,加上之前的44次探索性运行,总共优化了超过434,000个化合物。通过基于lid_root2(配体界面delta平方根归一化)评分的排名,选择前10,000个化合物进行重新对接。
所有通过筛选标准的化合物基于Tanimoto相似性进行聚类,最终选择100个不同的簇并进行可视化。经过专家驱动的命中选择会议,最终选择了216个化合物,通过Tanimoto相似性计算进一步筛选出150个化合物进行采购。最终订购的109个化合物中,101个成功合成,合成成功率达92.7%。
实验验证发现了一个弱结合剂A(KD值为59μM),该分子由双组分反应生成。基于这个初始命中,研究人员进行了支架探索,将形成初始命中的两个底物分别与构建反应的所有可能伙伴重新组合,生成18,193个化合物。这些分子通过RosettaLigand针对REvoLd生成最多化合物的三个结构模型进行对接,最终获得304个富含四唑化合物的分子。
第二轮实验评估发现了四个新的潜在结合剂,其中两个显示显著较低的亲和力(KD值分别为290μM和335μM),一个显示增强的结合能力(KD=35μM),另一个KD值为100μM并在差示扫描荧光法(Differential Scanning Fluorimetry, DSF)中显示弱稳定效应。与初始命中A相比,化合物D形成了更丰富的相互作用网络,包括两个氢键和一个π-π相互作用。
该管道在138个测试分子中产生了五个初步命中,其中三个分子的解离常数KD值优于150μM,命中率为2.17%。虽然低于ULLS报告的平均命中率(6.7-7.6%),但明显高于典型的体外高通量命中率(0.01-0.14%)。在CACHE挑战赛的最终排名中,该方法在23个参与者中获得了第10名的位置。
研究揭示了RosettaLigand评分函数存在的偏差,特别是对四唑和富氮环的偏好。在最好的10,000个研究化合物中,6,117个含有四唑基序,这种评分偏差影响了最终化合物的选择。进化优化协议的另一个缺点是其与结合模式优化的潜在相互作用,REvoLd可能不是在优化实际结合亲和力,而是在优化使RosettaLigand对接更容易的分子。
研究结论表明,通过结合分子动力学模拟、进化优化、经典配体对接和过滤以及专家指导选择的多步骤工作流程,成功为LRRK2的WDR40结构域鉴定了潜在的配体。尽管存在管道限制,但在CACHE挑战赛的严格期限内完成了研究,并成功开发了以Rosetta和REvoLd为核心的简化工作流程。这项研究代表了REvoLd算法的首次实际应用,为未来改进奠定了坚实基础,特别是针对WD40蛋白家族这类难以靶向的蛋白质目标。
该研究的重要意义在于提供了计算药物发现方法的前瞻性验证,证明了进化算法在超大型化学空间探索中的有效性,为靶向传统上认为"不可成药"的蛋白质目标(如WD40结构域)提供了新思路。同时,研究也揭示了当前计算筛选方法的局限性,特别是评分函数偏差对结果的影响,为未来方法改进指明了方向。这些发现不仅对帕金森病治疗开发具有重要价值,也为计算药物发现领域的算法发展和优化提供了宝贵经验。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号